特定のファイル形式内でパターン間の行数を見つける

Question

ソートされていない出力：

何千ものjsonファイルを含む私のファイルツリーで、以下を試してください。

$ find . -type f -name "*[0-9].json" \
    -exec bash -c 'printf "%4d %s\n" $(jq ".bbx_basic[]" "$1" | wc -l) "$1"' bashscript {} ';'
[Example output in my tests]
 130 ./Images/Training_set/00000845.json
  13 ./Images/Training_set/00005869.json
  13 ./Images/Training_set/00000991.json
  26 ./Images/Training_set/00005631.json
1013 ./Images/Training_set/00001737.json
...
 410 ./Annot_txt/Coco_en_2017/instances_val2017.json
   0 ./Annot_txt/Coco_en_2017/instances_val2017.json

これにより、検索は通常のファイルに制限され、私のパターンで指定されたファイル名を見つけます*[0-9].json。あなたの場合は、次のコマンドを実行する必要があります。

 $ find . -type f -name "notes.json" \
     -exec bash -c 'printf "%6d %s\n" $(jq ".text1[]" "$1" | wc -l) "$1"' bashscript {} ';'

種類出力：
- outfile変更されたコマンドは、ソートして標準出力に送信するよりも多くの操作を実行したい場合に備えて、ソートされていない出力を中間一時ファイル（名前）に保存します。/tmp/必要に応じて、ディレクトリ内のファイルを見つけることができます。
- 逆ソートは最初の（数値）フィールドで実行されるため、指定されたロケールに依存してはいけません。
- find終了状態に関係なくバックグラウンド実行ジョブが終了すると、ソートが開始されます。

パスワード：

$ find . -type f -name "notes.json" \
    -exec bash -c 'printf "%6d %s\n" $(jq ".text1[]" "$1" | wc -l) "$1" 2>/dev/null >> outfile' bashscript {} ';'; sort -k1,1nr outfile

上記の内容は、次の方法で同時により強力で柔軟にすることができます。

$ find . -type f -name "notes.json" -exec sh -c '
    for file do
      printf "%6d %s\n" $(jq ".text1[]" "$file" 2>/dev/null | wc -l) "$file"
    done' sh {} + >> outfile; sort -k1,1nr outfile

結果は同じですが、@StéphaneChazelasの提案による改善は次のとおりです。

sh携帯性を高めるよりも使用することでbash、
結果をファイルごとに処理find ...-exec sh -c '...'（）する代わりに、バッチ（）で生成されるシェルの数を最小限に抑えます。+\;find
outputfind以前のようにファイルごとにリダイレクトするのではなく、出力全体をリダイレクトして開いているファイル記述子（）の数を最小限に抑えます。

Answer 1

ソートされていない出力：