有没有办法知道分配的节点何时在 Slurm 中可用?

Is there a way to know when allocated nodes become available in Slurm?

sinfo 仅显示当前状态(allocidle 等)和 Slurm 节点的时间限制。 squeue好像只显示一个用户自己提交的职位,不显示其他用户提交的职位。

有没有办法知道其他用户分配的节点何时可用?

Is there a way to know when the nodes allocated by other users would become available?

唯一可靠的方法是提交工作。然后 Slurm 可以通过 --mail-type=BEGIN 的电子邮件警告您。

请注意,sbatch 有一个 --test-only 参数,它告诉您如果提交作业,您的作业何时会 运行,而不是实际提交作业。

此外,srun 有一个 --immediate 参数,允许提交和作业,如果它在几秒钟内没有获得分配则可以取消它。 sbatch 有一个类似的参数 --deadline

最后,如果您需要交互式会话并且在工作开始时有空,您可以使用 --begin 提交工作。例如,如果您想在第二天的同一时间进行交互式会话,请在前一天(假设合理的工作长度)提交一份工作 --begin=now+24hours