SLURM 中的每节点默认分区

Per-node default partition in SLURM

我正在配置一个小型集群,由 SLURM 控制。

这个集群有一个主节点和两个分区。 用户从工作节点提交他们的工作,我限制了他们对主节点的访问。 集群中的每个分区专用于我们公司的一个团队。

我希望不同团队的成员将他们的工作提交到不同的分区,而不必费心使用额外的命令行开关。

也就是说,我希望 srunsbatch 的默认分区因节点而异,运行 这些命令。

例如:主机 worker1 提交的所有作业都应该转到 partition1, 以及主机 worker[2-4] 提交的所有作业都应该转到 partition2.

并且 sbatchsrun 的所有调用不应包含 -p(或 --partition)开关。

我试过在不同计算机上 slurm.conf 文件的不同行设置 default=YES,但这没有帮助。

这可以使用SLURM_PARTITIONSBATCH_PARTITION环境变量解决,放在/etc/environment文件中。

环境变量的详细信息在 sbatchsrun

的手册页中