当 运行 SLURM 命令 "squeue" 时提到的这个 "AssocGrpNodeLimit" 是什么?
What is this "AssocGrpNodeLimit" mentioned when running the SLURM command "squeue"?
什么是AssocGrpNodeLimit
? squeue
命令显示它列为 "reason" 我的工作尚未 运行ning。我很惊讶,因为一些节点是空闲的。我的优先级是我见过的最高的(2126)。我已经用 Google 搜索了它,然后我发现它是 slurm_protocol_defs.c 中的 return 值:
/* Given a job's reason for waiting, return a descriptive string */
extern char *job_reason_string(enum job_state_reason inx)
{
...
case WAIT_ASSOC_GRP_NODE:
return "AssocGrpNodeLimit";
根据组成 "AssocGrpNodeLimit" 的单词和单词片段,我猜测与我属于同一组的人使用了太多节点,所以我的工作不会 运行?
AssocGrpNodeLimit 是为提交作业的关联 设置的节点数限制。
您可以使用 sacctmgr show assoc
检查限制,如果不受管理员限制,您还可以使用 squeue -A <account_name>
列出特定帐户的作业
术语关联的定义来自http://slurm.schedmd.com/sacctmgr.html(强调原文):
Slurm account information is recorded based upon four parameters that form what is referred to as an association. These parameters are
user, cluster, partition, and account. user is the login name. cluster
is the name of a Slurm managed cluster as specified by the ClusterName
parameter in the slurm.conf configuration file. partition is the name
of a Slurm partition on that cluster. account is the bank account for
a job.
什么是AssocGrpNodeLimit
? squeue
命令显示它列为 "reason" 我的工作尚未 运行ning。我很惊讶,因为一些节点是空闲的。我的优先级是我见过的最高的(2126)。我已经用 Google 搜索了它,然后我发现它是 slurm_protocol_defs.c 中的 return 值:
/* Given a job's reason for waiting, return a descriptive string */
extern char *job_reason_string(enum job_state_reason inx)
{
...
case WAIT_ASSOC_GRP_NODE:
return "AssocGrpNodeLimit";
根据组成 "AssocGrpNodeLimit" 的单词和单词片段,我猜测与我属于同一组的人使用了太多节点,所以我的工作不会 运行?
AssocGrpNodeLimit 是为提交作业的关联 设置的节点数限制。
您可以使用 sacctmgr show assoc
检查限制,如果不受管理员限制,您还可以使用 squeue -A <account_name>
术语关联的定义来自http://slurm.schedmd.com/sacctmgr.html(强调原文):
Slurm account information is recorded based upon four parameters that form what is referred to as an association. These parameters are user, cluster, partition, and account. user is the login name. cluster is the name of a Slurm managed cluster as specified by the ClusterName parameter in the slurm.conf configuration file. partition is the name of a Slurm partition on that cluster. account is the bank account for a job.