複数のバックグラウンドジョブのデータをBashの単一のデータストリームに再結合する方法

Question

これまでの私の素朴なアプローチは、一時フォルダを作成し、PIDを追跡し、各スレッドにそのPIDをファイルに書き込むようにし、すべての作業が完了したら、すべてのPIDを読み取り、順番にマージすることです。 PIDがファイルとして生成されました。

これはGNU Parallelが行うこととほぼ同じです。

parallel do_stuff ::: job1 job2 job3 ... jobn > output

いくつかの追加の利点があります。

GNU Parallelには、タスクをより小さなタスクに分割する多くの機能があります。たぶん、これらのうちの1つを使って小さな仕事を作ることができますか？

Answer 1

これまでの私の素朴なアプローチは、一時フォルダを作成し、PIDを追跡し、各スレッドにそのPIDをファイルに書き込むようにし、すべての作業が完了したら、すべてのPIDを読み取り、順番にマージすることです。 PIDがファイルとして生成されました。

これはGNU Parallelが行うこととほぼ同じです。

parallel do_stuff ::: job1 job2 job3 ... jobn > output

いくつかの追加の利点があります。

GNU Parallelには、タスクをより小さなタスクに分割する多くの機能があります。たぶん、これらのうちの1つを使って小さな仕事を作ることができますか？

おすすめ記事