以用户身份获取 SLURM 集群中允许的最大作业数
Get maximum number of jobs allowed in SLURM cluster as a user
我在基于 SLURM 的集群上工作,我想知道是否存在命令(或要查看的配置文件)我可以 运行 作为用户了解最大值我被允许同时 运行 的工作数量(我没有在 Slurm 文档中找到它)。有这样的命令吗?
您应该研究的资源限制是 MaxJobs
。
如 the docs 中所述,可以通过多种方式进行设置。每个用户关联、每个帐户(用户组)、每个集群。此外,直接通过关联或通过服务质量 (QOS) 进行设置。
您应该首先检查哪些帐户与您的用户相关联,例如sacctmgr list user $USER
.
然后,您可以用sacctmgr list associations
检查MaxJobs
。查看您的帐户(靠近列表顶部)和您的用户。
最后,使用 sacctmgr show qos
检查 QOS 设置的值(查找 MaxJobsPU
和 MaxJobsPA
,每个用户和每个帐户 IIRC)。
我在基于 SLURM 的集群上工作,我想知道是否存在命令(或要查看的配置文件)我可以 运行 作为用户了解最大值我被允许同时 运行 的工作数量(我没有在 Slurm 文档中找到它)。有这样的命令吗?
您应该研究的资源限制是 MaxJobs
。
如 the docs 中所述,可以通过多种方式进行设置。每个用户关联、每个帐户(用户组)、每个集群。此外,直接通过关联或通过服务质量 (QOS) 进行设置。
您应该首先检查哪些帐户与您的用户相关联,例如sacctmgr list user $USER
.
然后,您可以用sacctmgr list associations
检查MaxJobs
。查看您的帐户(靠近列表顶部)和您的用户。
最后,使用 sacctmgr show qos
检查 QOS 设置的值(查找 MaxJobsPU
和 MaxJobsPA
,每个用户和每个帐户 IIRC)。