mpirun は、インターネット接続が失われると並列プロセス ssh を終了します。

mpirun は、インターネット接続が失われると並列プロセス ssh を終了します。

SSH 経由で接続し、並列プロセスが実行中の場合、すべての並列プロセスへのインターネット接続が切断されます。再接続すると、ログファイルに次のメッセージが表示されます。

--------------------------------------------------------------------------
MPI_ABORT was invoked on rank 12 in communicator MPI COMMUNICATOR 4 DUP FROM 0 
with errorcode 15.

NOTE: invoking MPI_ABORT causes Open MPI to kill all MPI processes.
You may or may not see output from other processes, depending on
exactly when Open MPI kills them.
--------------------------------------------------------------------------
0:Terminate signal was sent, status=: 15
(rank:0 hostname: pid:2953):ARMCI DASSERT fail. ../../ga-5-4/armci/src/common/signaltrap.c:SigTermHandler():477 cond:0

分配する

説明: Ubuntu 16.04.6 LTS バージョン:
16.04 コード名: xenial

この衝突をどのように防ぐことができますか?

ベストアンサー1

tmuxはここに解決策です。問題は、SSH接続が閉じられると、実行中のすべてのbashセッションが終了することです。この問題を解決するには、次のように入力してtmuxrunと入力してプログラムの実行を開始します。その後、ctrl + bを押してからdを押して終了できます。これにより、コードは別のbashセッションで実行され、sshを閉じても引き続き実行されます。ssh user@ip ps aユーザーとIPを物理IPに置き換えて実行し、接続を閉じた後もプロセスが実行され続けていることを確認できます。

おすすめ記事