MPI pi 计算中的节点计数无效

Question

我正在尝试并行化以下代码来计算圆周率。

我的做法是用scatter并行化for，然后用reduce计算sum值，最后显示pi。

我的代码如下

#include <stdio.h>
#include <mpi.h> 

long num_steps = 100000;
double step = 1.0/100000.0;

int main() {

int i, myid, size;
double x, pi, local_sum = 0.0, sum=0.0;
double send_vec[num_steps], recv_vect[num_steps]; 

// Initialize the MPI environment 
MPI_Init(NULL, NULL); 
MPI_Comm_size(MPI_COMM_WORLD, &size); 
MPI_Comm_rank(MPI_COMM_WORLD,&myid);

if (myid ==0){
    int i=0; 
    for (i=0; i<num_steps;i++){
        send_vec[i]=i;
    }
}

MPI_Scatter(send_vec, num_steps/size, MPI_INT, recv_vect, 
    num_steps, MPI_INT, 0, MPI_COMM_WORLD);

for(i = 0; i < num_steps; ++i) {
    x = (recv_vect[i]-0.5)*step;
    local_sum += 4.0/(1.0+x*x);
}

MPI_Reduce(&local_sum, &sum, 1, MPI_DOUBLE, MPI_SUM, 0, MPI_COMM_WORLD);

if (myid == 0){
    pi = step*sum;
    printf("PI value = %f\n", pi);  
 }

// Finalize the MPI environment. 
MPI_Finalize();
}

事情是当我运行带有选项 -np 1 和 2 的程序时我确实得到了想要的结果。

然而，当我运行使用 3、4 和更高版本时，出现以下错误：

PIC_Send(284).........: Negative count, value is -240000
Fatal error in PMPI_Scatter: Invalid count, error stack

Answer 1

对MPI_Scatter()的调用待更正：

MPI_Scatter(send_vec, num_steps/size, MPI_INT, recv_vect, 
num_steps, MPI_INT, 0, MPI_COMM_WORLD);

要发送 double，请像在 MPI_Reduce()

MPI_DOUBLE

由于sendtype类似于recvtype，发送到每个进程的项目数sendcount必须等于每个进程接收的项目数recvcount.在本例中，它是 num_steps/size.

最后，对 MPI_Scatter() 的调用将如下所示：

MPI_Scatter(send_vec, num_steps/size, MPI_DOUBLE, recv_vect, 
num_steps/size, MPI_DOUBLE, 0, MPI_COMM_WORLD);

最后，可以使用动态内存分配来避免使用堆栈来存储大型数组。此外，可以减少分配的 space 以减少内存占用：

num_steps=(num_steps/size)*size;
double* send_vec=NULL;
double* recv_vec=NULL;
if(rank==0){
   send_vec=malloc((num_steps/size)*sizeof(double));
   if(send_vec==NULL){fprintf(stderr,"malloc failed\n");exit(1);}
}
recv_vec=malloc(num_steps*sizeof(double));
if(recv_vec==NULL){fprintf(stderr,"malloc failed\n");exit(1);}

...

if(rank==0){
   free(send_vec);
}
free(recv_vec);

MPI pi 计算中的节点计数无效

Invalid node count in MPI pi calculation

c

parallel-processing

openmp

openmpi