Slurmエラーで無効なノード名を見つけるには: "sbatch:エラー:バッチジョブの送信に失敗しました:指定されたノード名が正しくありません。"

Slurmエラーで無効なノード名を見つけるには:

このbashスクリプトの場合、「sbatch:エラー:バッチジョブの送信失敗:指定されたノード名が無効です」というエラーが発生します。

#!/bin/bash -l
#SBATCH --gpus=1
#SBATCH -p overcap
#SBATCH -A overcap
#SBATCH --signal=USR1@120
#SBATCH --time=10:00
#SBATCH --requeue
#SBATCH --nodelist=brainiac,omgwth,cyborg,sonny,robby,spd-13,qt-1,dave,nestor,crushinator,deebot,xaea-12,baymax,megabot,randotron,chappie,heistotron,roberto,herbie,shakey,chitti,samantha,clippy,kitt,tachikoma
#SBATCH -o err_test.out

srun python src/train.py

リストからどのノードが有効でないかを調べる方法はありますか?

ベストアンサー1

slurm で構成された有効なノード名のリストを使用またはsinfoインポートできます。sinfo -N次に、スクリプトの内容と比較してください。

おすすめ記事