在 clearcase 环境中启动并行 bsub 作业

launching parallel bsub job in clearcase environment

如果指定了 1 个以上的主机,ClearCase 不能与 LSF 分布式多主机并行作业结合使用。

原因:ClearCase 在向 LSF 系统分派多主机模拟时没有在所有主机上挂载文件系统

作业被终止,因为找不到包含的文件或因为文件系统不存在于所有主机上而无法输出。

ClearCase + LSF 实现必须通过构造保证作业在所有情况下 100% 正确分派,而目前情况并非如此。

请帮我解决这个问题。

LSF/Clearcase 集成使用 daemon.wrap 程序在执行主机上设置视图,然后在视图内启动作业。该包装器不支持跨主机并行作业。

您必须尝试解决作业脚本中的限制。您可以通过确保未在作业提交环境中设置 $CLEARCASE_ROOT 来禁用守护程序包装器。然后在作业脚本中,在执行环境中,在参与并行作业的每个进程中,作业脚本可以调用 cleartool setview <options> <real job command>.

如果你开始你的工作,那么它可能会让事情变得更容易。如果没有 blaunch,LSF 将在第一台执行主机上启动单个进程。使用 blaunch,LSF 将在每个插槽启动一个进程,并在所有分配的执行主机上启动它。使用 blaunch,每个进程都可以设置视图并开始真正的工作。

祝你好运!