Slurm - 作业状态显示失败,但仍生成输出
Slurm - Job State says failed, but output still generated
我在集群上安排了一个 slurm 作业和 运行。它是一个运行 MATLAB .m 文件的简单 sbatch
。完成 运行 后,输出(两个图)按预期成功生成。但是,当我执行 sacct
时,作业状态显示为 "FAILED" 并且退出代码显示为“9:0”。对我来说,它应该改为 COMPLETED。
在我的sbatch
文件中,我确实指定了error
和output
,这两个文件确实生成了没有内容。
有人可以帮忙吗?
作业最终状态由提交脚本的 return 代码决定,它又是提交脚本最后一个命令的 return 代码。所以最合理的解释是,即使 Matlab 脚本运行良好,提交脚本的最后一个命令却没有。如果 Matlab 是 脚本的最后一个命令,那么它看起来 return 一个非零代码,可能是因为某些清洁任务无法执行。
我在集群上安排了一个 slurm 作业和 运行。它是一个运行 MATLAB .m 文件的简单 sbatch
。完成 运行 后,输出(两个图)按预期成功生成。但是,当我执行 sacct
时,作业状态显示为 "FAILED" 并且退出代码显示为“9:0”。对我来说,它应该改为 COMPLETED。
在我的sbatch
文件中,我确实指定了error
和output
,这两个文件确实生成了没有内容。
有人可以帮忙吗?
作业最终状态由提交脚本的 return 代码决定,它又是提交脚本最后一个命令的 return 代码。所以最合理的解释是,即使 Matlab 脚本运行良好,提交脚本的最后一个命令却没有。如果 Matlab 是 脚本的最后一个命令,那么它看起来 return 一个非零代码,可能是因为某些清洁任务无法执行。