Slurm - 作业状态显示失败,但仍生成输出

Slurm - Job State says failed, but output still generated

我在集群上安排了一个 slurm 作业和 运行。它是一个运行 MATLAB .m 文件的简单 sbatch。完成 运行 后,输出(两个图)按预期成功生成。但是,当我执行 sacct 时,作业状态显示为 "FAILED" 并且退出代码显示为“9:0”。对我来说,它应该改为 COMPLETED。

在我的sbatch文件中,我确实指定了erroroutput,这两个文件确实生成了没有内容。

有人可以帮忙吗?

作业最终状态由提交脚本的 return 代码决定,它又是提交脚本最后一个命令的 return 代码。所以最合理的解释是,即使 Matlab 脚本运行良好,提交脚本的最后一个命令却没有。如果 Matlab 脚本的最后一个命令,那么它看起来 return 一个非零代码,可能是因为某些清洁任务无法执行。