複数のノードで構成されるクラスタでどのマシンがアイドル状態であるかを見つける方法

複数のノードで構成されるクラスタでどのマシンがアイドル状態であるかを見つける方法

32個のノード/マシンで構成されたクラスタで測定を実行しています。すべてのノードが必要なわけではありません。たとえば、4つだけです。問題は、ほとんどの場合、ノードが他の人によって過度の作業を行っていることです。したがって、良い結果を得るために空きノードを見つけるために、最初のtopマシンから始めて4つの空きノードが見つかるまで、すべてのマシンでコマンドを実行しました。

複数のコンピュータで同時にCPU負荷/使用率をテストし、可能であれば、あまり忙しいコンピュータを一覧表示する方法はありますか?

ベストアンサー1

@wnoiseの答えはより良い解決策ですが、これを実装できない可能性があります(たとえば、クラスタを管理していますか?)...だから、どう見ますか?

  1. 「クラスターSSH」ソリューションの1つここで言及した(pssh、pdsh、Clustersh、Clusterit)または
  2. 構造@Crankyadminもこの記事で言及しました。)

使用統計を収集します。

少しスクリプトを追加各ホストから収集した統計を評価すると、準備が完了します。

)あなたの好みによって言及されているツールの1つがより便利かもしれません。つまり、FabricはPythonフレームワークなので、Pythonで評価を実行したい場合に適している可能性があります(Perl / Bash /任意のスクリプトに関係ありません)。言語も同様に良いです)。

おすすめ記事