根据资源请求在slurm中设置队列

Setting up queues in slurm based on resource request

我很好奇是否有一种方法可以设置 Slurm 分区,以便调度程序查询可用分区并根据请求的资源量分配给分区,例如。假设我有几个队列:

small_cpu = node1,2,3          <- assigned when requesting <= 10 cores
large_cpu = node4,5,6          <- assigned when requesting > 10 cores
big_mem = node7,8,9            <- assign when requesting > 100GB memory
fail/backfill = nodes10,11,12  <- assigned when the other queues are full

我可以在 PBS/Moab 中执行此操作,但我在尝试弄清楚 Slurm 文档时遇到困难。任何见解表示赞赏。

在 Slurm 中执行此操作的方法是使用作业提交插件,该插件允许您将任何逻辑合并到作业路由中以进行分区(以及更多)。

查看示例 here