HPC で Bash プロセスが終了しました。

HPC で Bash プロセスが終了しました。

私はbashスクリプトに初めてアクセスし、以下のスクリプトを使用してジョブの送信を自動化しています。スクリプトは、前のジョブが完了するのを待ってから自動的に新しいジョブを送信します。

while true 
do
        jobstat=$(squeue -u $USER | grep DNAJB6 | wc -l)

        if [[ "$jobstat" == '0' ]]; then
                sbatch per3_restart.sh
                break
        fi

done

./script.sh &ログインノードで実行します。

top | grep bashしばらく(おそらく一日程度)実行した後の出力です。それ以降は、grepプロセスIDを使用しても表示されません。

PID USER      PR  NI    VIRT    RES    SHR S  %CPU %MEM     TIME+ COMMAND
26054 vadupa    20   0  140428   3052    836 S   0.3  0.0   0:04.47 bash

ただし、一定時間が経過すると、エラーメッセージや警告なしにプロセスが自動的に終了します。

私は何を逃したことがありませんか?教えてください。ありがとうございます。

編集する:

進行状況を確認するために頻繁にログアウトしてからログインします。

出力は次のとおりですbash -x script.sh > /tmp/trace.txt 2>&1 &

+ [[ hxB =~ i ]]
+ export -f module
+ ENV=/hpc/eb/modules-tcl-1.923/init/profile.sh
+ export ENV
+ BASH_ENV=/hpc/eb/modules-tcl-1.923/init/bash
+ export BASH_ENV
+ '[' 4 -ge 3 ']'
+ [[ hxB =~ i ]]
+ MODULESHOME=/hpc/eb/modules-tcl-1.923
+ export MODULESHOME
+ [[ ! :/hpc/sw/hpc/bin:/hpc/sw/hpc/sbin:/usr/lib64/qt-3.3/bin:/hpc/eb/compilerwrappers/compilers:/hpc/eb/compilerwrappers/linkers:/hpc/eb/modules-tcl-1.923/bin:/usr/local/bin:/usr/bin:/usr/local/sbin:/usr/sbin:/opt/ibutils/bin:/home/vadupa/bin: =~ :/hpc/eb/modules-tcl-1\.923/bin: ]]
++ manpath
+ manpath=/hpc/sw/hpc/man:/hpc/sw/hpc/man:/hpc/eb/modules-tcl-1.923/share/man:/usr/local/share/man:/usr/share/man/overrides:/usr/share/man:/opt/ibutils/share/man:/hpc/sw/hpc/man:/hpc/eb/modules-tcl-1.923/share/man:/usr/local/share/man:/usr/share/man/overrides:/usr/share/man:/opt/ibutils/share/man:/usr/share/man
+ [[ ! :/hpc/sw/hpc/man:/hpc/sw/hpc/man:/hpc/eb/modules-tcl-1.923/share/man:/usr/local/share/man:/usr/share/man/overrides:/usr/share/man:/opt/ibutils/share/man:/hpc/sw/hpc/man:/hpc/eb/modules-tcl-1.923/share/man:/usr/local/share/man:/usr/share/man/overrides:/usr/share/man:/opt/ibutils/share/man:/usr/share/man: =~ :/hpc/eb/modules-tcl-1\.923/share/man: ]]
+ '[' /sw/noarch/modulefiles/environment:/hpc/sw/modules/modulefiles/init:/hpc/sw/modules/modulefiles/init-devel = '' ']'
+ '[' compilerwrappers:surfsara = '' ']'
+ '[' -r /hpc/eb/modules-tcl-1.923/init/modulerc -a /sw/noarch/modulefiles/environment:/hpc/sw/modules/modulefiles/init:/hpc/sw/modules/modulefiles/init-devel = '' -a compilerwrappers:surfsara = '' ']'
+ true
++ squeue -u vadupa
++ wc -l
+ jobstat=2
+ [[ 2 == \1 ]]

ベストアンサー1

おすすめ記事