如何让 slurm 限制每个节点的内存
How to let slurm limit memory per node
Slurm 管理一个具有 8 核/64GB 内存和 16 核/128GB 内存节点的集群。
有一个低优先级 "long" 分区和一个高优先级 "short" 分区。
长分区中的作业 运行 可以被短分区中的作业挂起,在这种情况下,挂起作业的页面大部分被推送到交换区。 (交换使用仅用于此目的,不适用于活动作业。)
如何在 slurm 中配置每个节点中用于作业的 RAM+swap 总量?
有MaxMemPerNode
参数,但那是一个分区属性,因此无法容纳分区中不同节点的不同值。
有 MaxMemPerCPU
参数,但它会阻止低内存作业与大内存作业共享未使用的内存。
您需要在节点定义中使用RealMemory
参数指定每个节点的内存(参见slurm.conf manpage)
Slurm 管理一个具有 8 核/64GB 内存和 16 核/128GB 内存节点的集群。 有一个低优先级 "long" 分区和一个高优先级 "short" 分区。 长分区中的作业 运行 可以被短分区中的作业挂起,在这种情况下,挂起作业的页面大部分被推送到交换区。 (交换使用仅用于此目的,不适用于活动作业。)
如何在 slurm 中配置每个节点中用于作业的 RAM+swap 总量?
有MaxMemPerNode
参数,但那是一个分区属性,因此无法容纳分区中不同节点的不同值。
有 MaxMemPerCPU
参数,但它会阻止低内存作业与大内存作业共享未使用的内存。
您需要在节点定义中使用RealMemory
参数指定每个节点的内存(参见slurm.conf manpage)