Slurm Job Manager でノードの CPU/スレッド使用量を確認します。

Slurm Job Manager でノードの CPU/スレッド使用量を確認します。

私はSlurm Task Managerを使用してクラスタ化されたコンピュータで作業しています。私はマルチスレッドコードを起動し、特定のノードIDのコアとスレッドの使用量を確認したいと思います。例えば、

scoreusage -N 92512

「scoreusage」は不明なコマンドです。

ベストアンサー1

組み込みのSLURMツールは非常に基本的であることがわかりました。代わりに、同じものを使用してhtopリアルタイムでジョブを監視(実行中)できます。

  1. ジョブが実行されているノードを確認してください。
$ scontrol show job $JOB_ID | grep ' NodeList'
   NodeList=<HOSTNAME>
  1. sshノード入力:$ ssh <HOSTNAME>
  2. 必要に応じて監視プログラムを実行します。$ htop

おすすめ記事