如何让 slurm 限制每个节点的内存

How to let slurm limit memory per node

Slurm 管理一个具有 8 核/64GB 内存和 16 核/128GB 内存节点的集群。 有一个低优先级 "long" 分区和一个高优先级 "short" 分区。 长分区中的作业 运行 可以被短分区中的作业挂起,在这种情况下,挂起作业的页面大部分被推送到交换区。 (交换使用仅用于此目的,不适用于活动作业。)

如何在 slurm 中配置每个节点中用于作业的 RAM+swap 总量?

MaxMemPerNode参数,但那是一个分区属性,因此无法容纳分区中不同节点的不同值。

MaxMemPerCPU 参数,但它会阻止低内存作业与大内存作业共享未使用的内存。

您需要在节点定义中使用RealMemory参数指定每个节点的内存(参见slurm.conf manpage