如何使用 MPI_Scatter 和 MPI_Gather 计算多个进程的平均值?
How to calculate average across multiple processes using MPI_Scatter and MPI_Gather?
我正在尝试制作一个迷你 C 程序来理解 MPI
,我想让用户输入程序将接收多少个数字,数字,然后 scatter
它们在过程。然后每个进程将计算它的本地平均值,然后使用 gather
根进程将计算整个平均值。这些数字存储在一个固定大小的数组中。我遇到的问题是根进程不计算平均值,我不知道为什么。我像在其他示例中看到的那样分散和收集数字,但我无法使其工作。这就是我的。
#include <stdio.h>
#include "mpi.h"
int main(int argc, char** argv){
int my_rank;
int p;
int n;
int i;
int size;
int loc_num;
int loc_sum;
int fin=0;
int avg;
int loc_avg;
int root=0;
int data[100];
int data_loc[100];
int data_aver[100];
int final_res[100];
MPI_Init(&argc, &argv);
MPI_Comm_rank(MPI_COMM_WORLD, &my_rank);
MPI_Comm_size(MPI_COMM_WORLD, &p);
if (my_rank == 0){
printf("Input how many numbers: ");
scanf("%d", &n);
printf("Input the elements of the array: ");
for(i=0; i<n; i++){
scanf("%d", &data[i]);
}
}
MPI_Bcast(&n, 1, MPI_INT, root, MPI_COMM_WORLD);
loc_num = n/p;
MPI_Scatter(&data, loc_num, MPI_INT, data_loc, loc_num, MPI_INT, root, MPI_COMM_WORLD);
for(i=0; i< loc_num; i++){
loc_sum += data_loc[i];
loc_avg = loc_sum / loc_num;
}
if(my_rank==0){
MPI_Gather(&loc_avg, loc_num, MPI_INT, final_res, loc_num, MPI_INT, root, MPI_COMM_WORLD);
for(i=0; i<n; i++){
fin += final_res[i];
}
avg=fin/n;
printf("Final average: %d \n", avg);
}
MPI_Finalize();
return 0;
}
您的代码存在一些小问题,即未使用的变量和未初始化的变量。你应该用一些 warning flags 来编译你的代码,比如 -Wall
和 -pedantic
,等等。那些警告用户上述问题的标志。
此外,您可以更改此设置:
for(i=0; i< loc_num; i++){
loc_sum += data_loc[i];
loc_avg = loc_sum / loc_num;
}
到
for(i=0; i< loc_num; i++){
loc_sum += data_loc[i];
}
loc_avg = loc_sum / loc_num;
您需要将变量 loc_sum
初始化为零,因为代码与该变量的第一次交互是执行 loc_sum += data_loc[i];
,否则是 undefined behavior.
而且由于平均值可以是浮点数,变量loc_avg
、avg
、fin
的数据类型应该是float
类型(或双)而不是 int
.
您正在呼叫 MPI_Gather
只有主人:
if(my_rank==0){
MPI_Gather(&loc_avg, loc_num, MPI_INT, final_res, loc_num, MPI_INT, root, MPI_COMM_WORLD);
for(i=0; i<n; i++){
fin += final_res[i];
}
avg=fin/n;
printf("Final average: %d \n", avg);
}
MPI_Gather
是一个收集通信指令,它应该被组内的所有进程调用。此外,您使用错误的参数调用 MPI_Gather,而不是 :
MPI_Gather(&loc_avg, loc_num, MPI_INT, final_res, loc_num, MPI_INT, root, MPI_COMM_WORLD);
调用
MPI_Gather(&loc_avg, 1, MPI_FLOAT, final_res, 1, MPI_FLOAT, root, MPI_COMM_WORLD);
这个 loc_num = n/p;
仅当输入可以在进程之间平均分配时才能正常工作,但是(例如)如果您有 10
和 4
进程的输入 loc_num = n/p;
将等于 2,因此每个进程将计算 2 of 10。因此,所有进程将计算 8
而不是 10
。这个我会留给你解决。或者,您可以假设 n/p
始终生成自然数。
最后,代替:
for(i=0; i<n; i++){
fin += final_res[i];
}
avg=fin/n;
你应该
for(i=0; i<p; i++){
fin += final_res[i];
}
avg=fin/p;
您想 sum
所有进程的本地平均值,因此使用进程总数“p”,而不是输入数组的大小“n”。
一些建议:
- 如果可以的话,声明变量尽可能接近它们被使用的代码;
- 给你的变量起一个更好的名字,例如,代替“n”和“p”,分别称为input_size和“total_processes”。
IMO 这提高了代码的可读性。通过所有这些更改,您的代码将如下所示:
#include <stdio.h>
#include "mpi.h"
int main(int argc, char** argv){
int my_rank;
int total_processes;
int root = 0;
int data[100];
int data_loc[100];
float final_res[100];
MPI_Init(&argc, &argv);
MPI_Comm_rank(MPI_COMM_WORLD, &my_rank);
MPI_Comm_size(MPI_COMM_WORLD, &total_processes);
int input_size = 0;
if (my_rank == 0){
printf("Input how many numbers: ");
scanf("%d", &input_size);
printf("Input the elements of the array: ");
for(int i=0; i<input_size; i++){
scanf("%d", &data[i]);
}
}
MPI_Bcast(&input_size, 1, MPI_INT, root, MPI_COMM_WORLD);
int loc_num = input_size/total_processes;
MPI_Scatter(&data, loc_num, MPI_INT, data_loc, loc_num, MPI_INT, root, MPI_COMM_WORLD);
int loc_sum = 0;
for(int i=0; i< loc_num; i++)
loc_sum += data_loc[i];
float loc_avg = (float) loc_sum / (float) loc_num;
MPI_Gather(&loc_avg, 1, MPI_FLOAT, final_res, 1, MPI_FLOAT, root, MPI_COMM_WORLD);
if(my_rank==0){
float fin = 0;
for(int i=0; i<total_processes; i++)
fin += final_res[i];
float avg = fin / (float) total_processes;
printf("Final average: %f \n", avg);
}
MPI_Finalize();
return 0;
}
测试输入:10个元素,元素为{1,2,3,4,5,6,7,8}
结果:
PROCESS=0 loc_avg=1.5 {1, 2}
PROCESS=1 loc_avg=3.5 {3, 4}
PROCESS=2 loc_avg=5.5 {5, 6}
PROCESS=3 loc_avg=7.5 {7, 8}
Final average: 4.500000
我正在尝试制作一个迷你 C 程序来理解 MPI
,我想让用户输入程序将接收多少个数字,数字,然后 scatter
它们在过程。然后每个进程将计算它的本地平均值,然后使用 gather
根进程将计算整个平均值。这些数字存储在一个固定大小的数组中。我遇到的问题是根进程不计算平均值,我不知道为什么。我像在其他示例中看到的那样分散和收集数字,但我无法使其工作。这就是我的。
#include <stdio.h>
#include "mpi.h"
int main(int argc, char** argv){
int my_rank;
int p;
int n;
int i;
int size;
int loc_num;
int loc_sum;
int fin=0;
int avg;
int loc_avg;
int root=0;
int data[100];
int data_loc[100];
int data_aver[100];
int final_res[100];
MPI_Init(&argc, &argv);
MPI_Comm_rank(MPI_COMM_WORLD, &my_rank);
MPI_Comm_size(MPI_COMM_WORLD, &p);
if (my_rank == 0){
printf("Input how many numbers: ");
scanf("%d", &n);
printf("Input the elements of the array: ");
for(i=0; i<n; i++){
scanf("%d", &data[i]);
}
}
MPI_Bcast(&n, 1, MPI_INT, root, MPI_COMM_WORLD);
loc_num = n/p;
MPI_Scatter(&data, loc_num, MPI_INT, data_loc, loc_num, MPI_INT, root, MPI_COMM_WORLD);
for(i=0; i< loc_num; i++){
loc_sum += data_loc[i];
loc_avg = loc_sum / loc_num;
}
if(my_rank==0){
MPI_Gather(&loc_avg, loc_num, MPI_INT, final_res, loc_num, MPI_INT, root, MPI_COMM_WORLD);
for(i=0; i<n; i++){
fin += final_res[i];
}
avg=fin/n;
printf("Final average: %d \n", avg);
}
MPI_Finalize();
return 0;
}
您的代码存在一些小问题,即未使用的变量和未初始化的变量。你应该用一些 warning flags 来编译你的代码,比如 -Wall
和 -pedantic
,等等。那些警告用户上述问题的标志。
此外,您可以更改此设置:
for(i=0; i< loc_num; i++){
loc_sum += data_loc[i];
loc_avg = loc_sum / loc_num;
}
到
for(i=0; i< loc_num; i++){
loc_sum += data_loc[i];
}
loc_avg = loc_sum / loc_num;
您需要将变量 loc_sum
初始化为零,因为代码与该变量的第一次交互是执行 loc_sum += data_loc[i];
,否则是 undefined behavior.
而且由于平均值可以是浮点数,变量loc_avg
、avg
、fin
的数据类型应该是float
类型(或双)而不是 int
.
您正在呼叫 MPI_Gather
只有主人:
if(my_rank==0){
MPI_Gather(&loc_avg, loc_num, MPI_INT, final_res, loc_num, MPI_INT, root, MPI_COMM_WORLD);
for(i=0; i<n; i++){
fin += final_res[i];
}
avg=fin/n;
printf("Final average: %d \n", avg);
}
MPI_Gather
是一个收集通信指令,它应该被组内的所有进程调用。此外,您使用错误的参数调用 MPI_Gather,而不是 :
MPI_Gather(&loc_avg, loc_num, MPI_INT, final_res, loc_num, MPI_INT, root, MPI_COMM_WORLD);
调用
MPI_Gather(&loc_avg, 1, MPI_FLOAT, final_res, 1, MPI_FLOAT, root, MPI_COMM_WORLD);
这个 loc_num = n/p;
仅当输入可以在进程之间平均分配时才能正常工作,但是(例如)如果您有 10
和 4
进程的输入 loc_num = n/p;
将等于 2,因此每个进程将计算 2 of 10。因此,所有进程将计算 8
而不是 10
。这个我会留给你解决。或者,您可以假设 n/p
始终生成自然数。
最后,代替:
for(i=0; i<n; i++){
fin += final_res[i];
}
avg=fin/n;
你应该
for(i=0; i<p; i++){
fin += final_res[i];
}
avg=fin/p;
您想 sum
所有进程的本地平均值,因此使用进程总数“p”,而不是输入数组的大小“n”。
一些建议:
- 如果可以的话,声明变量尽可能接近它们被使用的代码;
- 给你的变量起一个更好的名字,例如,代替“n”和“p”,分别称为input_size和“total_processes”。
IMO 这提高了代码的可读性。通过所有这些更改,您的代码将如下所示:
#include <stdio.h>
#include "mpi.h"
int main(int argc, char** argv){
int my_rank;
int total_processes;
int root = 0;
int data[100];
int data_loc[100];
float final_res[100];
MPI_Init(&argc, &argv);
MPI_Comm_rank(MPI_COMM_WORLD, &my_rank);
MPI_Comm_size(MPI_COMM_WORLD, &total_processes);
int input_size = 0;
if (my_rank == 0){
printf("Input how many numbers: ");
scanf("%d", &input_size);
printf("Input the elements of the array: ");
for(int i=0; i<input_size; i++){
scanf("%d", &data[i]);
}
}
MPI_Bcast(&input_size, 1, MPI_INT, root, MPI_COMM_WORLD);
int loc_num = input_size/total_processes;
MPI_Scatter(&data, loc_num, MPI_INT, data_loc, loc_num, MPI_INT, root, MPI_COMM_WORLD);
int loc_sum = 0;
for(int i=0; i< loc_num; i++)
loc_sum += data_loc[i];
float loc_avg = (float) loc_sum / (float) loc_num;
MPI_Gather(&loc_avg, 1, MPI_FLOAT, final_res, 1, MPI_FLOAT, root, MPI_COMM_WORLD);
if(my_rank==0){
float fin = 0;
for(int i=0; i<total_processes; i++)
fin += final_res[i];
float avg = fin / (float) total_processes;
printf("Final average: %f \n", avg);
}
MPI_Finalize();
return 0;
}
测试输入:10个元素,元素为{1,2,3,4,5,6,7,8}
结果:
PROCESS=0 loc_avg=1.5 {1, 2}
PROCESS=1 loc_avg=3.5 {3, 4}
PROCESS=2 loc_avg=5.5 {5, 6}
PROCESS=3 loc_avg=7.5 {7, 8}
Final average: 4.500000