「perf Record --a」（システム全体のコレクション）でプロファイルデータを分析するには？

Question

MPI を使用して計算を分散する場合、MPI 認識ツールを使用すると、よりスマートな結果が得られます。分散アプリケーションでは、あるMPIプロセスが別のプロセスからの入力を待っている間にアイドル状態の負荷不均衡の問題が発生する可能性があります。このMPIプロセスを正確に分析した場合、パフォーマンス分析は完全に間違っています。

したがって、最初のステップは通常、プログラムの通信とロードバランシングパターンを理解し、必要なワークロード（レベル0のCPU集約型）を提供するサンプル入力を識別することです。例えば、ミップ通信パターン、各MPI呼び出しに費やされた時間などの非常に完全なレポートを生成するMPI分析ツール。

その後、選択した 1 つ以上の MPI レベルでコード分析ツールを実行できます。とにかく、単一のMPIレベルでそれを使用するのは良い考えではありませんperf。その測定にはMPIライブラリコードのパフォーマンスも含まれます。これはおそらく望むものではないかもしれません。

Answer 1

MPI を使用して計算を分散する場合、MPI 認識ツールを使用すると、よりスマートな結果が得られます。分散アプリケーションでは、あるMPIプロセスが別のプロセスからの入力を待っている間にアイドル状態の負荷不均衡の問題が発生する可能性があります。このMPIプロセスを正確に分析した場合、パフォーマンス分析は完全に間違っています。

したがって、最初のステップは通常、プログラムの通信とロードバランシングパターンを理解し、必要なワークロード（レベル0のCPU集約型）を提供するサンプル入力を識別することです。例えば、ミップ通信パターン、各MPI呼び出しに費やされた時間などの非常に完全なレポートを生成するMPI分析ツール。

その後、選択した 1 つ以上の MPI レベルでコード分析ツールを実行できます。とにかく、単一のMPIレベルでそれを使用するのは良い考えではありませんperf。その測定にはMPIライブラリコードのパフォーマンスも含まれます。これはおそらく望むものではないかもしれません。

「perf Record --a」（システム全体のコレクション）でプロファイルデータを分析するには？

ベストアンサー1

おすすめ記事