如何使用 MPI Allreduce 添加犰狳向量?
How can I add armadillo vectors using MPI Allreduce?
我想对 Armadllio 向量执行 MPI_Allreduce operation
,但我得到 0 输出。本质上,我每个处理器都有 arma 向量 v。使用 MPI_Allreduce,我想添加 w 中的所有向量。我不确定是否必须添加一些同步。下面是我的代码。
#include <iostream>
#include <stdlib.h>
#include <mpi.h>
#include <math.h>
#include <assert.h>
#include<armadillo>
using namespace std;
using namespace arma;
int main(int argc, char** argv) {
MPI_Init(NULL, NULL);
int world_rank;
MPI_Comm_rank(MPI_COMM_WORLD, &world_rank);
int world_size;
MPI_Comm_size(MPI_COMM_WORLD, &world_size);
vec v(2,fill::randu);
vec w(2,fill::zeros);
MPI_Allreduce(&w, &v, 1, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
if(world_rank==0)
cout<<"w: "<<w<<endl;
MPI_Finalize();
}
我的输出:
w: 0
0
您的 MPI_Allreduce
通话有两个问题。首先,您的 vec
中有 2 个 double
,因此计数应为 2。其次,您已切换发送和接收缓冲区。
int MPI_Allreduce ( void *sendbuf, void *recvbuf, int count,
MPI_Datatype datatype, MPI_Op op, MPI_Comm comm )
所以你的命令应该是:
MPI_Allreduce(&v, &w, 2, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
假设犰狳向量中的数据从 class/struct 本身的第一个字节开始连续存储,这应该可以正常工作。
编辑:我仔细查看了犰狳文档。有一个函数 memptr()
其中 returns 指向数据本身的指针。这是您应该使用 MPI_Allreduce()
而不是 &vector
的内容。因此,您实际的函数调用应该是:
MPI_Allreduce(v.memptr(), w.memptr(), 2, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
我想对 Armadllio 向量执行 MPI_Allreduce operation
,但我得到 0 输出。本质上,我每个处理器都有 arma 向量 v。使用 MPI_Allreduce,我想添加 w 中的所有向量。我不确定是否必须添加一些同步。下面是我的代码。
#include <iostream>
#include <stdlib.h>
#include <mpi.h>
#include <math.h>
#include <assert.h>
#include<armadillo>
using namespace std;
using namespace arma;
int main(int argc, char** argv) {
MPI_Init(NULL, NULL);
int world_rank;
MPI_Comm_rank(MPI_COMM_WORLD, &world_rank);
int world_size;
MPI_Comm_size(MPI_COMM_WORLD, &world_size);
vec v(2,fill::randu);
vec w(2,fill::zeros);
MPI_Allreduce(&w, &v, 1, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
if(world_rank==0)
cout<<"w: "<<w<<endl;
MPI_Finalize();
}
我的输出:
w: 0
0
您的 MPI_Allreduce
通话有两个问题。首先,您的 vec
中有 2 个 double
,因此计数应为 2。其次,您已切换发送和接收缓冲区。
int MPI_Allreduce ( void *sendbuf, void *recvbuf, int count, MPI_Datatype datatype, MPI_Op op, MPI_Comm comm )
所以你的命令应该是:
MPI_Allreduce(&v, &w, 2, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
假设犰狳向量中的数据从 class/struct 本身的第一个字节开始连续存储,这应该可以正常工作。
编辑:我仔细查看了犰狳文档。有一个函数 memptr()
其中 returns 指向数据本身的指针。这是您应该使用 MPI_Allreduce()
而不是 &vector
的内容。因此,您实际的函数调用应该是:
MPI_Allreduce(v.memptr(), w.memptr(), 2, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);