提交 Condor 作业期间的代码更新

Code updates during submission of condor jobs

当使用 condor 在专用计算机集群中分发作业时,首先将作业提交到集群,然后等待它们真正开始 运行ning。根据多种因素,它们可能会在相当长的一段时间内处于空闲状态,甚至数小时。

假设我刚刚编译了作业中将要 运行 的代码。我可以通过 condor 提交文件提交作业。然后我意识到我想更改原始代码,因为其中有一些错误,或者因为我想尝试不同的参数。如果代码完成编译而作业仍处于空闲状态,集群中哪个版本将成为 运行?换句话说,condor 是在提交作业时以某种方式存储代码的快照,还是只是在作业开始时选择它 运行ning?

尽管我认为第一种选择听起来更合理,但我从自己的工作中得到证据表明第二种选择是实际发生的。

当condor_submit为运行时,可执行文件被复制到调度程序下的假脱机目录。这称为假脱机。如果您希望能够在提交后更改可执行文件,最好的办法可能是使您的可执行文件成为一个调用实际可执行文件的 shell 脚本,并将可执行文件放入 transfer_input_files 列表中。