以用户身份获取 SLURM 集群中允许的最大作业数

Get maximum number of jobs allowed in SLURM cluster as a user

我在基于 SLURM 的集群上工作,我想知道是否存在命令(或要查看的配置文件)我可以 运行 作为用户了解最大值我被允许同时 运行 的工作数量(我没有在 Slurm 文档中找到它)。有这样的命令吗?

您应该研究的资源限制是 MaxJobs

the docs 中所述,可以通过多种方式进行设置。每个用户关联、每个帐户(用户组)、每个集群。此外,直接通过关联或通过服务质量 (QOS) 进行设置。

您应该首先检查哪些帐户与您的用户相关联,例如sacctmgr list user $USER.

然后,您可以用sacctmgr list associations检查MaxJobs。查看您的帐户(靠近列表顶部)和您的用户。

最后,使用 sacctmgr show qos 检查 QOS 设置的值(查找 MaxJobsPUMaxJobsPA,每个用户和每个帐户 IIRC)。