在 slurm 上设置依赖于 QOS 的抢占

Setting up QOS-dependent preemption on slurm

我正在使用 SLURM 集群,该集群应该设置为允许基于 QOS 的抢占,但我不确定它是否已正确完成。是否正确地说,为了使它起作用,我们想要抢占另一个的每个 QOS 都必须明确列出它可以抢占的那些 QOS?换句话说,如果我 运行 $ sacctmgr list qos format==name,priority,preempt 并且 "preempt" 列为空,我们实际上 not 启用了基于 QOS 的抢占,无论PreemptType = preempt/qos?

是的,你是对的。例如在我们的设置中:

[root@master ~]# sacctmgr list qos format==name,priority,preempt
      Name   Priority    Preempt
---------- ---------- ----------
    normal          0
      high      10000     normal

具有 QOS high 的作业能够抢占具有 QOS normal 的作业。这种情况是通过运行一条命令获得的,例如:

sacctmgr modify qos where name=high set Preempt=normal