如何在 slurm 的 qos 上使用 maxTRESperuser 设置每个用户 cpu 的限制
How to set the limit of cpu per user using maxTRESperuser on qos for slurm
出于测试目的,我刚刚将 qos 参数 MaxTRESperuser 设置为 cpu=10,但 slurm 正在安排作业。
我用过:
sacctmgr modify qos normal set maxtresperuser=cpu=1
我们可以在
上查看
sacctmgr 显示 qos
Name Priority GraceTime Preempt PreemptMode Flags UsageThres UsageFactor GrpTRES GrpTRESMins GrpTRESRunMin GrpJobs GrpSubmit GrpWall MaxTRES MaxTRESPerNode MaxTRESMins MaxWall MaxTRESPU MaxJobsPU MaxSubmitPU MaxTRESPA MaxJobsPA MaxSubmitPA MinTRES
normal 0 00:00:00 cluster 1.000000 cpu=1
但同一用户发送的所有作业都已分配,每个作业使用 2 cpus
排队
JOBID PARTITION NAME USER ST TIME NODES NODELIST(REASON)
370 teste script.s root R 0:11 1 slurmcomputenode2.novalocal
371 teste script.s root R 0:11 1 slurmcomputenode2.novalocal
372 teste teste.sh root R 0:07 1 slurmcomputenode1.novalocal
slurm 文档没有说明任何其他内容。
我需要更改 slurm.conf 文件中的内容吗?
谢谢
确保 AccountingStorageEnforce
设置为 limits,qos
。您还需要适当考虑要执行的限制。见 documentation.
出于测试目的,我刚刚将 qos 参数 MaxTRESperuser 设置为 cpu=10,但 slurm 正在安排作业。
我用过:
sacctmgr modify qos normal set maxtresperuser=cpu=1
我们可以在
上查看sacctmgr 显示 qos
Name Priority GraceTime Preempt PreemptMode Flags UsageThres UsageFactor GrpTRES GrpTRESMins GrpTRESRunMin GrpJobs GrpSubmit GrpWall MaxTRES MaxTRESPerNode MaxTRESMins MaxWall MaxTRESPU MaxJobsPU MaxSubmitPU MaxTRESPA MaxJobsPA MaxSubmitPA MinTRES
normal 0 00:00:00 cluster 1.000000 cpu=1
但同一用户发送的所有作业都已分配,每个作业使用 2 cpus
排队
JOBID PARTITION NAME USER ST TIME NODES NODELIST(REASON)
370 teste script.s root R 0:11 1 slurmcomputenode2.novalocal
371 teste script.s root R 0:11 1 slurmcomputenode2.novalocal
372 teste teste.sh root R 0:07 1 slurmcomputenode1.novalocal
slurm 文档没有说明任何其他内容。 我需要更改 slurm.conf 文件中的内容吗?
谢谢
确保 AccountingStorageEnforce
设置为 limits,qos
。您还需要适当考虑要执行的限制。见 documentation.