Slurm:是否可以通过 sbatch 提供或更改提交作业的 pid
Slurm: Is it possible to give or change pid of the submitted job via sbatch
当我们通过 sbatch
提交作业时,作业的 pid 按增量顺序给出。根据我的观察,这个顺序又从 1 开始。
sbatch -N1 run.sh
Submitted batch job 20
//如果可能,目标是更改提交的批处理作业的 ID。
[Q1] 例如,slurm 下有一个 运行 作业。当我们重新启动节点时,作业是否继续 运行?它的 pid 是否得到更新或保持原样?
[Q2] 是否可以使用集群所有者想要提供的唯一 ID 来提供或更改已提交作业的 pid?
感谢您的宝贵时间和帮助。
如果节点失败,作业将重新排队 - 如果 slurm.conf
中的 JobRequeue
参数允许这样做。它将获得与之前启动的 运行 相同的作业 ID,因为这是数据库中用于管理作业的唯一标识符。 (用户可以使用 --no-requeue
sbatch 参数覆盖重新排队。)
无法更改作业 ID,不。
当我们通过 sbatch
提交作业时,作业的 pid 按增量顺序给出。根据我的观察,这个顺序又从 1 开始。
sbatch -N1 run.sh
Submitted batch job 20
//如果可能,目标是更改提交的批处理作业的 ID。
[Q1] 例如,slurm 下有一个 运行 作业。当我们重新启动节点时,作业是否继续 运行?它的 pid 是否得到更新或保持原样?
[Q2] 是否可以使用集群所有者想要提供的唯一 ID 来提供或更改已提交作业的 pid?
感谢您的宝贵时间和帮助。
如果节点失败,作业将重新排队 - 如果 slurm.conf
中的 JobRequeue
参数允许这样做。它将获得与之前启动的 运行 相同的作业 ID,因为这是数据库中用于管理作业的唯一标识符。 (用户可以使用 --no-requeue
sbatch 参数覆盖重新排队。)
无法更改作业 ID,不。