ディレクトリにx個のファイルがあり(x = 100より大きい)、このファイルの違いを比較したいとします。これをどのように実行できますか?私はUbuntu 18.04マシンを実行しています。議論のために、ディレクトリが/home/user1/music_list/で、そのディレクトリにあるファイルの1つが/home/user1/music_list/jazz1.txtであるとします。
ベストアンサー1
これは実際にはファイルが本質的に同じかどうかによって異なります。何千もの比較を提示することも、「参照バージョン」や一連の漸進的な修正を識別できない場合は完全に混乱します。
一度は、信頼性の問題がある排出メカニズムの問題を解決するように求められたことがあります。電力網サイトの各階層には、16,000個のイメージファイル、つまり250万個のファイルを持つ160個のサーバーがあります。
基本的に最も人気のあるバージョンに投票してもらいました。各サーバーには独自のファイルチェックサムがあり、チェックサム、日付、サイズ、名前のリストを私に送信します。チェックサムにグループ化して計算します。コレクション全体で100%一貫性のあるすべてのファイルが利用可能です。ケースの80%以上に一致するものには、更新がないサーバーが表示されます。 20%未満の場合、削除に失敗したか悪意のあるテストファイルです。 20~80%の範囲に入る人はほとんどいません。
私のユースケースでは、間違った名前またはパスで別のサーバーにアップロードされたイメージファイルを検出するのも簡単でした。
このアプローチは問題を解決できないかもしれませんが、必要な詳細比較の数を大幅に減らします。