コンテンツを独立して保持しながら、プログラム間で複数のファイルのコンテンツを転送します。

Question

他のファイルと同様に、パイプはテキストストリーム（より正確にはバイトストリーム）です。 Unixの基本的なビルディングブロックは単純な傾向があります。プロセス間の相互作用は主に非定型データに基づいています。オペレーティングシステムは、ファイル名でラベル付けされた複数のストリームを持つ通信チャネルを提供しません。プログラムがこれを行う必要がある場合は、ストリームごとにパイプを1つずつ独自のパイプを配置する必要があるのが最も自然な実装です。

program2とが各ストリームに独立して適用される場合、program3そのコピーは各ファイルに対して実行されます。順番に実行するには、シェルループを使用します。パイプと同様に、ループはプログラムを相互に接続するシェル機能の1つです。出力をどこに置くかを知らせるために、program3一般的なインタフェースはprogram3標準出力に書き込み、出力をファイルに指定するためにシェルのリダイレクト構造を使用することです。シェルは、ファイル名を作成するためのいくつかの基本的な文字列操作構成を提供します。これは単なる接続です。

for x in *.txt; do
  program1 "$x" | program2 | program3 >"folder/$x"
done

プログラムがIO集約的であるがCPU集約的であり、複数のCPUがある場合は、並行して実行することをお勧めします。まったく新しいGNUツールを使えば使えます。xargsプログラムを並列に実行します。システムのCPU数をパラメータとして渡します-P。実行する必要があるコマンドはxargsパイプなので、シェルを呼び出すように作成する必要があります。

find -maxdepth 1 -name '*.txt' -print0 |
xargs -0 -n 1 -P 4 sh -c 'program1 "$1" | program2 | program3 >"$0/$1"' "folder"

あなたはそれを使用することができますGNUパラレルxargsの代わりにシステムのCPU数を自動的に決定します。

parallel sh -c 'program1 "$1" | program2 | program3 >"$0/$1"' "folder" ::: *.txt

単一のインスタンスが必要program2でprogram3複数のファイルを処理する場合は、複数のパイプを入力として受け取るようにカスタムインターフェイスを使用してこれらのプログラムを設計する必要があります。これを行う標準的な方法はありません。 1つの方法は、入力を提供するプログラムを呼び出すことです。これは、出力を処理するためにどのプログラムを呼び出すかを知らせるxargsのと同じように機能します。parallel

Answer 1

他のファイルと同様に、パイプはテキストストリーム（より正確にはバイトストリーム）です。 Unixの基本的なビルディングブロックは単純な傾向があります。プロセス間の相互作用は主に非定型データに基づいています。オペレーティングシステムは、ファイル名でラベル付けされた複数のストリームを持つ通信チャネルを提供しません。プログラムがこれを行う必要がある場合は、ストリームごとにパイプを1つずつ独自のパイプを配置する必要があるのが最も自然な実装です。

program2とが各ストリームに独立して適用される場合、program3そのコピーは各ファイルに対して実行されます。順番に実行するには、シェルループを使用します。パイプと同様に、ループはプログラムを相互に接続するシェル機能の1つです。出力をどこに置くかを知らせるために、program3一般的なインタフェースはprogram3標準出力に書き込み、出力をファイルに指定するためにシェルのリダイレクト構造を使用することです。シェルは、ファイル名を作成するためのいくつかの基本的な文字列操作構成を提供します。これは単なる接続です。

for x in *.txt; do
  program1 "$x" | program2 | program3 >"folder/$x"
done

プログラムがIO集約的であるがCPU集約的であり、複数のCPUがある場合は、並行して実行することをお勧めします。まったく新しいGNUツールを使えば使えます。xargsプログラムを並列に実行します。システムのCPU数をパラメータとして渡します-P。実行する必要があるコマンドはxargsパイプなので、シェルを呼び出すように作成する必要があります。

find -maxdepth 1 -name '*.txt' -print0 |
xargs -0 -n 1 -P 4 sh -c 'program1 "$1" | program2 | program3 >"$0/$1"' "folder"

あなたはそれを使用することができますGNUパラレルxargsの代わりにシステムのCPU数を自動的に決定します。

parallel sh -c 'program1 "$1" | program2 | program3 >"$0/$1"' "folder" ::: *.txt

単一のインスタンスが必要program2でprogram3複数のファイルを処理する場合は、複数のパイプを入力として受け取るようにカスタムインターフェイスを使用してこれらのプログラムを設計する必要があります。これを行う標準的な方法はありません。 1つの方法は、入力を提供するプログラムを呼び出すことです。これは、出力を処理するためにどのプログラムを呼び出すかを知らせるxargsのと同じように機能します。parallel

コンテンツを独立して保持しながら、プログラム間で複数のファイルのコンテンツを転送します。

ベストアンサー1

おすすめ記事