ファイルセットの違いを経験的に発見

Question

どうですか？

mostdifs=-1;
for f1 in path/to/files/*.out; do 
    for f2 in path/to/files/*.out; do 
        difs=$(diff "$f1" "$f2" | wc -l); 
        [ "$difs" -gt "$mostdifs" ] && mostdifs=$difs && mostdif="$f1 : $f2";
    done 
done 
echo "$mostdif"

$f1これは非常に簡単で、他のファイルやその他のさまざまな調整で同じかどうかをテストすることで改善できます$f2。しかし、何百ものテキストファイルについて話している場合は、数秒で実行されるため、複雑さがさらに大きくなります。それは価値がないので可能です。

アイデアは、各ファイルのペアでそれを実行し、diff返される行数を確認することです。数値が現在の最大数より大きい場合、ファイル名が保存されます。

Answer 1

どうですか？

mostdifs=-1;
for f1 in path/to/files/*.out; do 
    for f2 in path/to/files/*.out; do 
        difs=$(diff "$f1" "$f2" | wc -l); 
        [ "$difs" -gt "$mostdifs" ] && mostdifs=$difs && mostdif="$f1 : $f2";
    done 
done 
echo "$mostdif"

$f1これは非常に簡単で、他のファイルやその他のさまざまな調整で同じかどうかをテストすることで改善できます$f2。しかし、何百ものテキストファイルについて話している場合は、数秒で実行されるため、複雑さがさらに大きくなります。それは価値がないので可能です。

アイデアは、各ファイルのペアでそれを実行し、diff返される行数を確認することです。数値が現在の最大数より大きい場合、ファイル名が保存されます。

ファイルセットの違いを経験的に発見

ベストアンサー1

おすすめ記事