使用 MPI(在 C 中)代码的矩阵乘法不工作超过 6 个节点
Matrix Multiplication Using MPI (in C) code isn't working more than 6 nodes
我正在尝试用 MPI 编写一个 C 程序,主进程生成两个二维数组。
第一个矩阵(称为A)的行分布到所有从节点(使用MPI_Scatter),第二个矩阵(称为B)被复制到所有从节点(使用MPI_Bcast)。
矩阵 A 的行被复制到另一个一维数组中,并将 A 的行与矩阵 B 的行相乘。乘法的结果使用 MPI_Gather 收集在第三个二维数组(称为 C)中。
当我输入4或5个节点和4*4或5*5大小的数组时,它工作正常。
例如,当我输入
这样的命令时它工作正常
$mpiexec -n 5 -f machinefile ./mpi_test3 5
(->第二个5的意思是数组的大小,意思是两个5*5的矩阵相乘。)
但是当我输入超过6个节点和6*6大小时它不起作用。
例如,
$mpiexec -n 6 -f machinefile ./mpi_test3 6
我的代码是这样的。
#include <stdio.h>
#include <stdlib.h>
#include <mpi.h>
#include <time.h>
int main(int argc, char* argv[])
{
int i, j, k,m, ran, size, myrank, nprocs;
int a[size][size], b[size][size], c[size][size],ar[size],cr[size];
ran=10;
size= atoi(argv[1]);
MPI_Init(&argc,&argv);
MPI_Comm_size(MPI_COMM_WORLD, &nprocs);
MPI_Comm_rank(MPI_COMM_WORLD, &myrank);
//Initialization of Receive Buffer
for(i=0;i<size;++i){
cr[i]=0;
}
// make random values and put it into the two Matrix
if(myrank==0){
srand((unsigned)time(NULL));
for(i=0; i<size; ++i)
{
for(j=0; j<size; ++j)
{
a[i][j]= rand()%ran+1;
b[i][j]= rand()%ran+1;
}
}
}
//MPI SCATTER & BROAD CAST
MPI_Scatter(a,size,MPI_INT,&ar,size,MPI_INT,0,MPI_COMM_WORLD);
MPI_Bcast(b,size*size,MPI_INT,0,MPI_COMM_WORLD);
for(i=0;i<size;i++)
{
for(j=0;j<size;++j)
{
cr[i]+=ar[j]*b[j][i];
}
}
MPI_Gather(cr,size,MPI_INT,c,size,MPI_INT,0,MPI_COMM_WORLD);
//Print the Result of Multiplication
if(myrank==0){
printf("\t Result of Multiplication \n");
for(i=0; i<size; ++i){
for(j=0; j<size; ++j)
{
printf("%d ",c[i][j]);
}
printf("\n");
}
}
MPI_Finalize();
return 0;
}
我的机器文件是这样的。
clus15:2
clus16:2
clus17:2
clus18:2
我的代码有什么问题?
在定义数组之前需要定义大小。
int a[size][size], b[size][size], c[size][size],ar[size],cr[size];
此时size是一个未定义的变量,那些数组在函数进入之前分配在栈上。
int a[atoi(argv[1])][atoi(argv[1])]...,cr[atoi(argv[1])];
此外,并非所有编译器都支持在函数中初始化可变大小的数组。
或者,您可以按以下方式动态分配这些数组:
int **a, **b, **c, **ar, *cr;
/* Be sure to check return value of malloc after each call */
a = malloc(sizeof(*a)*size);
b = malloc(sizeof(*b)*size);
c = malloc(sizeof(*c)*size);
ar = malloc(sizeof(*ar)*size);
cr = malloc(sizeof(*cr)*size);
/* Be sure to check return value of malloc after each call */
for (int i = 0 ; i < size ; i++)
a[i] = malloc(sizeof(**a)*size)
b[i] = malloc(sizeof(**b)*size)
c[i] = malloc(sizeof(**c)*size)
ar[i] = malloc(sizeof(**ar)*size)
目前您处于未定义行为的领域,因为数组实际上并未初始化为您想要的大小,而是在初始化之前具有驻留在大小中的非确定性值。
尝试
printf("Size of cr: %d\n", (sizeof(cr)/sizeof(cr[0]));
在主函数中,查看数组大小是否等于您输入的参数。
我正在尝试用 MPI 编写一个 C 程序,主进程生成两个二维数组。
第一个矩阵(称为A)的行分布到所有从节点(使用MPI_Scatter),第二个矩阵(称为B)被复制到所有从节点(使用MPI_Bcast)。
矩阵 A 的行被复制到另一个一维数组中,并将 A 的行与矩阵 B 的行相乘。乘法的结果使用 MPI_Gather 收集在第三个二维数组(称为 C)中。
当我输入4或5个节点和4*4或5*5大小的数组时,它工作正常。 例如,当我输入
这样的命令时它工作正常$mpiexec -n 5 -f machinefile ./mpi_test3 5
(->第二个5的意思是数组的大小,意思是两个5*5的矩阵相乘。)
但是当我输入超过6个节点和6*6大小时它不起作用。 例如,
$mpiexec -n 6 -f machinefile ./mpi_test3 6
我的代码是这样的。
#include <stdio.h>
#include <stdlib.h>
#include <mpi.h>
#include <time.h>
int main(int argc, char* argv[])
{
int i, j, k,m, ran, size, myrank, nprocs;
int a[size][size], b[size][size], c[size][size],ar[size],cr[size];
ran=10;
size= atoi(argv[1]);
MPI_Init(&argc,&argv);
MPI_Comm_size(MPI_COMM_WORLD, &nprocs);
MPI_Comm_rank(MPI_COMM_WORLD, &myrank);
//Initialization of Receive Buffer
for(i=0;i<size;++i){
cr[i]=0;
}
// make random values and put it into the two Matrix
if(myrank==0){
srand((unsigned)time(NULL));
for(i=0; i<size; ++i)
{
for(j=0; j<size; ++j)
{
a[i][j]= rand()%ran+1;
b[i][j]= rand()%ran+1;
}
}
}
//MPI SCATTER & BROAD CAST
MPI_Scatter(a,size,MPI_INT,&ar,size,MPI_INT,0,MPI_COMM_WORLD);
MPI_Bcast(b,size*size,MPI_INT,0,MPI_COMM_WORLD);
for(i=0;i<size;i++)
{
for(j=0;j<size;++j)
{
cr[i]+=ar[j]*b[j][i];
}
}
MPI_Gather(cr,size,MPI_INT,c,size,MPI_INT,0,MPI_COMM_WORLD);
//Print the Result of Multiplication
if(myrank==0){
printf("\t Result of Multiplication \n");
for(i=0; i<size; ++i){
for(j=0; j<size; ++j)
{
printf("%d ",c[i][j]);
}
printf("\n");
}
}
MPI_Finalize();
return 0;
}
我的机器文件是这样的。
clus15:2
clus16:2
clus17:2
clus18:2
我的代码有什么问题?
在定义数组之前需要定义大小。
int a[size][size], b[size][size], c[size][size],ar[size],cr[size];
此时size是一个未定义的变量,那些数组在函数进入之前分配在栈上。
int a[atoi(argv[1])][atoi(argv[1])]...,cr[atoi(argv[1])];
此外,并非所有编译器都支持在函数中初始化可变大小的数组。
或者,您可以按以下方式动态分配这些数组:
int **a, **b, **c, **ar, *cr;
/* Be sure to check return value of malloc after each call */
a = malloc(sizeof(*a)*size);
b = malloc(sizeof(*b)*size);
c = malloc(sizeof(*c)*size);
ar = malloc(sizeof(*ar)*size);
cr = malloc(sizeof(*cr)*size);
/* Be sure to check return value of malloc after each call */
for (int i = 0 ; i < size ; i++)
a[i] = malloc(sizeof(**a)*size)
b[i] = malloc(sizeof(**b)*size)
c[i] = malloc(sizeof(**c)*size)
ar[i] = malloc(sizeof(**ar)*size)
目前您处于未定义行为的领域,因为数组实际上并未初始化为您想要的大小,而是在初始化之前具有驻留在大小中的非确定性值。
尝试
printf("Size of cr: %d\n", (sizeof(cr)/sizeof(cr[0]));
在主函数中,查看数组大小是否等于您输入的参数。