LSF:关于请求节点,独占选择节点和运行 mpirun

LSF: about requesting nodes, exclusively selecting nodes and running mpirun

我对在多用户集群环境中提交作业感到很困惑。我使用带有以下 head

的脚本
#BSUB -L /bin/bash
#BSUB -n 10
#BSUB -J jobname
#BSUB -oo log/output.%J
#BSUB -eo log/error.%J
#BSUB -q queue_name
#BSUB -P project_name
#BSUB -R "span[ptile=12]"
#BSUB -W 2:0

mpirun ./someexecutable

在我的意图中,这个作业应该 运行 在 10 个处理器(核心)上并且跨越 1 个整个节点(因为机器上的每个节点都有 12 个核心),所以节点完全由我使用并且没有其他用户干扰我的节点。我已经明确检查过,看起来我的代码在 运行 时间使用了 10 个内核。

现在我正在和某人交谈,他们告诉我这样我实际上需要 120 个内核。我认为这是不对的,但也许我误解了说明

https://www.ibm.com/support/knowledgecenter/en/SSWRJV_10.1.0/lsf_admin/span_string.html

我可以改用吗?

#BSUB -R "span[hosts=1]" 

In my intention, this jobs should run on 10 processors (cores) and span 1 entire node

是的,您想使用

#BSUB -n 10
#BSUB -R "span[hosts=1]"

这意味着只将作业放在 1 台主机上。

and no other user interfere on my node

您可以使用

获得对主机的独占访问权限
#BSUB -x

仅供参考。你可以想到

#BSUB -R "span[ptile=x]"

as,在单个主机上最多放置 x 个插槽。