マルチコアCLIコマンドの問題

マルチコアCLIコマンドの問題

私の12コアコンピュータ上のファイルで実行される150のCLIコマンドバーがあります。バックグラウンドで150個のジョブをすべて実行するとシステムが停滞し、経験上12~18個のジョブを実行するのが最適であることがわかりました。

過去には、150個のコマンドを12個または13個のバッチファイルに分割し、それぞれを実行するために分割コマンドを使用していました。ただし、一部のバッチファイルは他のバッチファイルの前に完了し、残りの9つまたは8つのコアはアイドル状態ですが、完了に時間がかかる3〜4個のバッチファイルが作成されます。

私の目標は、150個のCLIコマンドがすべて実行されるまで、12個のコアをすべて実行し続けることです。

各プロセッサが150個のCLIコマンドのリストからジョブをインポートし、そのコマンドを実行中としてマークし、残りの11個のプロセッサが150個のプロセッサがすべて完了するまで独自のエントリをインポートできるようにすることはできますか?プロセッサは互いに転倒しない。同じCLIコマンドをインポートしますか?作成されたファイルは一意でなければなりません。

これを行う簡単な方法はありますか?

ベストアンサー1

GNU Parallelを使用すると、次のようになります。

cat 150commands.txt | parallel

各コアは1つのタスクを実行します。

GNU Parallelは、同じコンピュータまたはSSHを介してアクセスできる複数のコンピュータでタスクを並列に簡単に実行できる汎用の並列ハンドラです。多くの場合for、ループを置き換えることができます。

4つのCPUで32の異なるジョブを実行する場合は、並列化する簡単な方法は、各CPUで8つのジョブを実行することです。

簡単なスケジューリング

代わりに、GNU Parallel はタスクが完了すると新しいプロセスを作成し、CPU をアクティブに保つことで時間を節約します。

GNU並列スケジューリング

インストールする

ディストリビューションにGNU Parallelがパッケージされていない場合は、rootアクセスなしでプライベートインストールを実行できます。これは10秒で完了できます。

(wget -O - pi.dk/3 || curl pi.dk/3/ || fetch -o - http://pi.dk/3) | bash

その他のインストールオプションについては、以下を参照してください。http://git.savannah.gnu.org/cgit/parallel.git/tree/README

詳細

より多くの例を見る:http://www.gnu.org/software/parallel/man.html

紹介ビデオを見る:https://www.youtube.com/playlist?list=PL284C9FF2488BC6D1

このチュートリアルを見てください。http://www.gnu.org/software/parallel/parallel_tutorial.html

サポートを受けるには、メールリストに参加してください。https://lists.gnu.org/mailman/listinfo/parallel

おすすめ記事