コンピュータクラスタを使用してノードを管理します。トルクそしてモアブ。
ユーザーはノードにジョブを送信し、必要なリソース量を要求できます。
#The following submits the job foo.sh to 1 node, requesting 8 cores, and 1 gpu
qsub foo.sh -l nodes=1:ppn=8:gpus=1
ユーザーが要求したリソースよりも多くのリソースを取得できるため、有効にしました。hwlocライブラリ(cpusets)を使用してユーザーを制御します。
私が見つけたところによると、ユーザーが要求したよりも多くのGPUを使用するのを防ぐ方法はありません。
「cpuset」に対応するGPUはありますか?
リソース