torque/pbs 调度程序如何工作?

How does torque/pbs scheduler work?

上网看了一会,除了github上的源码外,只有torque的使用教程。

有人可以概述一下它的实际工作原理吗?算法是什么?

我问这个是因为我想了解什么是扩展复杂性,它与 spark/hadoop 在作业启动时间方面的比较。我认为这些问题将通过对事物如何运作的基本理解来澄清。例如,是否类似于linux的CFS?

在 Torque 中,调度程序与队列、作业和进程管理分离。这意味着可以 运行 不同的调度程序。

Torque 提供的两个免费调度器是

  • 实现带约束的 fifo 的基本调度程序 pbs_sched
  • MAUI 实现了多种调度策略,例如公平共享、基于挂钟限制的回填和可调的 FIFO 策略。

另请阅读 MOAB,一种商用的扭矩调度程序。