SLURM 中的每节点默认分区
Per-node default partition in SLURM
我正在配置一个小型集群,由 SLURM 控制。
这个集群有一个主节点和两个分区。
用户从工作节点提交他们的工作,我限制了他们对主节点的访问。
集群中的每个分区专用于我们公司的一个团队。
我希望不同团队的成员将他们的工作提交到不同的分区,而不必费心使用额外的命令行开关。
也就是说,我希望 srun
或 sbatch
的默认分区因节点而异,运行 这些命令。
例如:主机 worker1
提交的所有作业都应该转到 partition1
,
以及主机 worker[2-4]
提交的所有作业都应该转到 partition2
.
并且 sbatch
或 srun
的所有调用不应包含 -p
(或 --partition
)开关。
我试过在不同计算机上 slurm.conf
文件的不同行设置 default=YES
,但这没有帮助。
这可以使用SLURM_PARTITION
和SBATCH_PARTITION
环境变量解决,放在/etc/environment
文件中。
环境变量的详细信息在 sbatch
和 srun
的手册页中
我正在配置一个小型集群,由 SLURM 控制。
这个集群有一个主节点和两个分区。 用户从工作节点提交他们的工作,我限制了他们对主节点的访问。 集群中的每个分区专用于我们公司的一个团队。
我希望不同团队的成员将他们的工作提交到不同的分区,而不必费心使用额外的命令行开关。
也就是说,我希望 srun
或 sbatch
的默认分区因节点而异,运行 这些命令。
例如:主机 worker1
提交的所有作业都应该转到 partition1
,
以及主机 worker[2-4]
提交的所有作业都应该转到 partition2
.
并且 sbatch
或 srun
的所有调用不应包含 -p
(或 --partition
)开关。
我试过在不同计算机上 slurm.conf
文件的不同行设置 default=YES
,但这没有帮助。
这可以使用SLURM_PARTITION
和SBATCH_PARTITION
环境变量解决,放在/etc/environment
文件中。
环境变量的详细信息在 sbatch
和 srun