AssocMaxWallDurationPerJobLimit 在 slurm 中是什么意思?

What does AssocMaxWallDurationPerJobLimit mean in slurm?

我提交了一份工作,但我得到:

               253       x86 brando_j miranda9 PD       0:00      1 (AssocMaxWallDurationPerJobLimit)

这是什么意思?

我的sbatch脚本如下:

#!/bin/bash
#SBATCH --job-name="brando_job"
#SBATCH --output="main.sh.o%j.%N"
#SBATCH --partition=x86
#SBATCH --time=47:00:00
#SBATCH --nodes=1
#SBATCH --ntasks-per-node=32
#SBATCH --sockets-per-node=1
#SBATCH --cores-per-socket=16
#SBATCH --threads-per-core=2
#SBATCH --mem-per-cpu=32000
#SBATCH --gres=gpu:a100:4
#SBATCH --export=ALL

这意味着请求的持续时间 #SBATCH --time=47:00:00 相对于您帐户的限制来说太长了。

你可以用

检查一下
sacctmgr show user $USER withassoc format=account,user,partition,MaxWallDurationPerJob