ディレクトリで最大のファイルを見つける - 時間がかかります

Question

いずれにせよ、その中のすべてのディレクトリの内容を読み、実行する必要がありますlstat()。つまり、どのファイルが最大であるかを判断する前に、inodeデータを読み取ってすべてのファイルのファイルサイズを調べることを意味します。

ディスク（またはネットワークファイルシステムの場合はネットワーク）I / Oアクセス（すべての情報がメモリにキャッシュされていない場合）は、最も時間がかかる部分です。

あなたの方法は、ユーザー/グループIDをユーザー/グループ名に変換し、タイムスタンプのカレンダー表現を計算し、バイトを文字にデコードするなど、不要なタスクをたくさん実行し、これらのタスクはCPUとディスクを使い続けます。ただし、ディスクI / Oはまだ忙しい状態になる可能性があります。ボトルネック。

zsh例のglobおよびglob修飾子を使用すると、不要な処理の大部分をスキップできます。

ls -ldS /opt/apps/**/*(.DOL[1,10])

zsh Oファイルのリストは長さ（明白なサイズ）でソートされますが、まだサイズでソートするL必要があります。それ以外の場合は名前で並べ替えられます。 GNU実装では、を使用してソートをスキップできます。実装では、人間が読めるサイズ（KMGTPE ... 1024ベースのサフィックスを使用）のオプションもサポートされており、他の多くの実装からコピーされました。-SlsSlsls-U-hh

または（最新の）GNUツールを使用してください。

(export LC_ALL=C # avoid decoding bytes into characters and
                 # complex sorting orders. Note that it may affect
                 # the ls -l output format though.
 find /opt/apps -type f -printf '%s/%p\0' |
   sort -srnz |
   head -z |
   cut -zd/ -f2- |
   xargs -r0 ls -ldS)

これで作業を迅速にすることを確認してください。

Answer 1