工作永远排在队列中(Condor - Parallel Universe)
Jobs are stuck in queue forever ( Condor - Parallel Universe )
我最近尝试配置 HTcondor。我成功地提交了串行(Vanilla Universe)作业,没有任何错误或问题。但是当我尝试提交并行 ( Parallel Universe ) 作业时,作业似乎永远卡在队列中。
***提交文件代码:
universe = parallel
executable = SommeP
output = outputP.$(NODE)
error = errorP.$(NODE)
log = logP
machine_count = 4
should_transfer_files = yes
when_to_transfer_output = on_exit
queue
***Condor_q
enter image description here
***Condor_status(1主2从共6槽)
enter image description here
您的 Condor 池的管理员必须配置执行节点以将您的提交节点视为专用调度程序,然后才能安排并行宇宙作业。有关详细信息,请参阅手册中的并行应用程序部分:http://research.cs.wisc.edu/htcondor/manual/current/2_9Parallel_Applications.html#SECTION00392000000000000000
我最近尝试配置 HTcondor。我成功地提交了串行(Vanilla Universe)作业,没有任何错误或问题。但是当我尝试提交并行 ( Parallel Universe ) 作业时,作业似乎永远卡在队列中。
***提交文件代码:
universe = parallel
executable = SommeP
output = outputP.$(NODE)
error = errorP.$(NODE)
log = logP
machine_count = 4
should_transfer_files = yes
when_to_transfer_output = on_exit
queue
***Condor_q
enter image description here
***Condor_status(1主2从共6槽) enter image description here
您的 Condor 池的管理员必须配置执行节点以将您的提交节点视为专用调度程序,然后才能安排并行宇宙作业。有关详细信息,请参阅手册中的并行应用程序部分:http://research.cs.wisc.edu/htcondor/manual/current/2_9Parallel_Applications.html#SECTION00392000000000000000