クラスタの小さなノードで小規模のmakeジョブを実行しましたが、ソートプロセスが割り当てられたRAMを圧倒しているようで、20時間後に終了しました(他のサンプルの同じジョブは4〜5時間で完了しました)。その後、出力ファイルを削除し、RAMがより多くのノードでジョブを再実行しました。 htopは、新しいノードで1時間実行された後、一部のプロセスが20〜55時間実行されたことを示します。 htopは表示された累積実行時間をどのように計算しますか? 1時間実行されたことが55時間続いたと考えるのはなぜですか?
私はこれらのプロセスが呼び出されるファイルに基づいて特定のタスクに関連していると確信しています。