COMPAS - 节点已填充错误

COMPSs - Nodes already filled error

提交 COMPS 申请后,我收到以下错误消息,申请未执行。

MPI_CMD=mpirun -timestamp-output -n 1 -H s00r0
/apps/COMPSs/1.3/Runtime/scripts/user/runcompss
--project=/tmp/1668183.tmpdir/project_1458303603.xml
--resources=/tmp/1668183.tmpdir/resources_1458303603.xml
--uuid=2ed20e6a-9f02-49ff-a71c-e071ce35dacc
/apps/FILESPACE/pycompssfile arg1 arg2 : -n 1 -H s00r0
/apps/COMPSs/1.3/Runtime/scripts/system/adaptors/nio/persistent_worker_starter.sh
/apps/INTEL/mkl/lib/intel64 null
/home/myhome/kmeans_python/src/ true
/tmp/1668183.tmpdir 4 5 5 s00r0-ib0 43001 43000 true 1
/apps/COMPSs/1.3/Runtime/scripts/system/2ed20e6a-9f02-49ff-a71c-e071ce35dacc : -n 1 -H s00r0
/apps/COMPSs/1.3/Runtime/scripts/system/adaptors/nio/persistent_worker_starter.sh
/apps/INTEL/mkl/lib/intel64 null
/home/myhome/kmeans_python/src/ true
/tmp/1668183.tmpdir 4 5 5 s00r0-ib0 43001 43000 true 2
/apps/COMPSs/1.3/Runtime/scripts/system/2ed20e6a-9f02-49ff-a71c-e071ce35dacc

--------------------------------------------------------------------------
All nodes which are allocated for this job are already filled.
--------------------------------------------------------------------------

我正在使用 COMPS 1.3。

为什么会这样?

您正在尝试 运行 同一节点中的主节点和工作节点。带有 NIO 适配器(默认选项)的集群中的 COMPSs 1.3 使用 mpi运行 在集群的不同节点中生成主进程和工作进程,而安装在集群中的 mpi运行 不允许去做这个。

解决方法如下:

  1. 您没有在 enqueue_compss 命令中指定 --tasks_in_master=。
  2. 您使用 GAT 适配器 (--comm=integratedtoolkit.gat.master.GATAdaptor) 执行,这有更多的开销

下一个 COMPS 软件版本将使用不同集群资源管理器(如 blaunch、s运行)中可用的 spawn 命令,必须解决此问题