何千ものファイルを関連付ける: > vs >>

Question

2番目の例：

find . -name '*.txt' -print0 | xargs -0 cat > out.txt

完全に正当なout.txtファイルが実行されるたびに再生成され、最初のファイルのout.txt実行がリンクされます。しかし、両方のコマンドは本質的に同じことを行います。

この質問は混乱していますxargs -0 cat。人々はリダイレクトがコマンドout.txtの一部だと思いますが、そうではありません。リダイレクトはxargs -o catSTDINを介して入力を受け取り、その出力を単一のストリームとしてSTDOUTに出力した後に発生します。これはxargs、出力ではなく最適化されたファイルのディレクトリです。

ここに私が言う内容の例があります。pv -lとファイル出力の間に1つを挿入すると、catが何行を書いたかがわかります。xargs -0 catout.txt

はい

これを示すために、10,000個のファイルを含むディレクトリを作成しました。

for i in `seq -w 1 10000`;do echo "contents of file$i.txt" > file$i.txt;done

各ファイルは次のようになります。

$ more file00001.txt 
contents of file00001.txt

出力pv：

$ find . -name '*.txt' -print0 | xargs -0 cat | pv -l > singlefile.rpt
  10k 0:00:00 [31.1k/s] [  <=>

singlefile.rptご覧のとおり、私のファイルには10,000行が記録されています。出力ブロックが渡されると、減少するxargs行数が表示されることがわかりますpv。

Answer 1