如何使用 MPI Allreduce 添加犰狳向量?

How can I add armadillo vectors using MPI Allreduce?

我想对 Armadllio 向量执行 MPI_Allreduce operation,但我得到 0 输出。本质上,我每个处理器都有 arma 向量 v。使用 MPI_Allreduce,我想添加 w 中的所有向量。我不确定是否必须添加一些同步。下面是我的代码。

#include <iostream>
#include <stdlib.h>
#include <mpi.h>
#include <math.h>
#include <assert.h>
#include<armadillo>  

using namespace std;
using namespace arma;

int main(int argc, char** argv) {


MPI_Init(NULL, NULL);

int world_rank;
MPI_Comm_rank(MPI_COMM_WORLD, &world_rank);
int world_size;
MPI_Comm_size(MPI_COMM_WORLD, &world_size);

vec v(2,fill::randu);

vec w(2,fill::zeros);

MPI_Allreduce(&w, &v, 1, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
if(world_rank==0)
cout<<"w: "<<w<<endl;
MPI_Finalize();
}

我的输出:

 w:     0
      0

您的 MPI_Allreduce 通话有两个问题。首先,您的 vec 中有 2 个 double,因此计数应为 2。其次,您已切换发送和接收缓冲区。

int MPI_Allreduce ( void *sendbuf, void *recvbuf, int count, MPI_Datatype datatype, MPI_Op op, MPI_Comm comm )

所以你的命令应该是:

MPI_Allreduce(&v, &w, 2, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);

假设犰狳向量中的数据从 class/struct 本身的第一个字节开始连续存储,这应该可以正常工作。

编辑:我仔细查看了犰狳文档。有一个函数 memptr() 其中 returns 指向数据本身的指针。这是您应该使用 MPI_Allreduce() 而不是 &vector 的内容。因此,您实际的函数调用应该是:

MPI_Allreduce(v.memptr(), w.memptr(), 2, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);