OpenMPI:SGE 集群上的主机密钥验证失败

OpenMPI: Host key verification failed on SGE cluster

我最近在我的 SGE 集群上安装了 OpenMPI 2.0 版。但是当我提交一份工作时,我得到 "Host ket verification failed"。即使我能够在没有提交主机的密码的情况下登录到该节点(compute10)。

输出文件中的错误:

Warning: no access to tty (Bad file descriptor). Thus no job control in this shell. Wed Jan 30 15:58:53 EST 2019 Host key verification failed. [file orca_main/gtoint.cpp, line 137]: ORCA finished by error termination in ORCA_GTOInt

我的 SGE 脚本如下:

!/bin/tcsh

$ -q sge-queue@compute10

$ -pe mpi 8

$ -V

$ -cwd

$ -j y

$ -l h_vmem=64G

date

setenv OMP_NUM_THREADS 8

/home/user/orca_4_0_1_2_linux_x86-64_openmpi202/orca ccl3.inp > ccl3.out

date

和我的并行环境mpi:

pe_name mpi

slots 999

user_lists NONE

xuser_lists NONE

start_proc_args /export/sge6.2_U7/mpi/startmpi.sh -catch_rsh $pe_hostfile

stop_proc_args /export/sge6.2_U7/mpi/stopmpi.sh

allocation_rule $pe_slots

control_slaves TRUE

job_is_first_task FALSE

urgency_slots min

accounting_summary TRUE

尝试各种方法后,将 OpenMPI 更新到 3.1.0 版本并使用以下选项构建解决了问题。

./configure --prefix=/usr/local --with-sge --enable-orterun-prefix-by-default