AssocMaxWallDurationPerJobLimit 在 slurm 中是什么意思?
What does AssocMaxWallDurationPerJobLimit mean in slurm?
我提交了一份工作,但我得到:
253 x86 brando_j miranda9 PD 0:00 1 (AssocMaxWallDurationPerJobLimit)
这是什么意思?
我的sbatch脚本如下:
#!/bin/bash
#SBATCH --job-name="brando_job"
#SBATCH --output="main.sh.o%j.%N"
#SBATCH --partition=x86
#SBATCH --time=47:00:00
#SBATCH --nodes=1
#SBATCH --ntasks-per-node=32
#SBATCH --sockets-per-node=1
#SBATCH --cores-per-socket=16
#SBATCH --threads-per-core=2
#SBATCH --mem-per-cpu=32000
#SBATCH --gres=gpu:a100:4
#SBATCH --export=ALL
这意味着请求的持续时间 #SBATCH --time=47:00:00
相对于您帐户的限制来说太长了。
你可以用
检查一下
sacctmgr show user $USER withassoc format=account,user,partition,MaxWallDurationPerJob
我提交了一份工作,但我得到:
253 x86 brando_j miranda9 PD 0:00 1 (AssocMaxWallDurationPerJobLimit)
这是什么意思?
我的sbatch脚本如下:
#!/bin/bash
#SBATCH --job-name="brando_job"
#SBATCH --output="main.sh.o%j.%N"
#SBATCH --partition=x86
#SBATCH --time=47:00:00
#SBATCH --nodes=1
#SBATCH --ntasks-per-node=32
#SBATCH --sockets-per-node=1
#SBATCH --cores-per-socket=16
#SBATCH --threads-per-core=2
#SBATCH --mem-per-cpu=32000
#SBATCH --gres=gpu:a100:4
#SBATCH --export=ALL
这意味着请求的持续时间 #SBATCH --time=47:00:00
相对于您帐户的限制来说太长了。
你可以用
检查一下sacctmgr show user $USER withassoc format=account,user,partition,MaxWallDurationPerJob