需要帮助并行化导致分段错误的 ran2 和主程序 openmp
Need help parallelising the ran2 and main program causing segmentation fault openmp
我尝试将循环并行化,但增加线程数让我只剩下 'Segmentation fault(core dumped)'
我已经并行化了 main.c 中的循环,该循环在内部引用了 ran2.c 文件函数,这在某处导致了分段错误,我需要并行化程序的帮助。
main.c:
#include <stdlib.h>
#include <stdio.h>
int main(int argc, char **argv) {
int niter, i, j;
long seed;
double count;
double x,y,z,pi;
extern float ran2();
niter=10000;
count=0;
#pragma omp parallel firstprivate(x, y, z, i) shared(count) num_threads(4)
for(i=1; i<=niter; i++) {
seed=i;
x=ran2(&seed);
y=ran2(&seed);
z=x*x+y*y;
if(z<1) {
count+=1;
}
}
pi=count*4.0/niter;
printf("The value of pi is %8.14f\n",pi);
return 0;
}
ran2.c
#define IM2 2147483399
#define IM1 2147483563
#define AM (1.0/IM1)
#define IMM1 (IM1-1)
#define IA1 40014
#define IA2 40692
#define IQ1 53668
#define IQ2 52774
#define IR1 12211
#define IR2 3791
#define NTAB 32
#define NDIV (1+IMM1/NTAB)
#define EPS 1.2e-7
#define RNMX (1.0-EPS)
float ran2(long *idum) {
int j;
long k;
static long idum2=123456789;
static long iy=0;
static long iv[NTAB];
float temp;
if (*idum <= 0) {
if (-(*idum) < 1)
*idum=1;
else *idum = -(*idum);
idum2=(*idum);
for (j=NTAB+7; j>=0; j--) {
k=(*idum)/IQ1;
*idum=IA1*(*idum-k*IQ1)-k*IR1;
if (*idum < 0)
*idum += IM1;
if (j < NTAB)
iv[j] = *idum;
}
iy=iv[0];
}
k=(*idum)/IQ1;
*idum=IA1*(*idum-k*IQ1)-k*IR1;
if (*idum < 0)
*idum += IM1;
k=idum2/IQ2;
idum2=IA2*(idum2-k*IQ2)-k*IR2;
if (idum2 < 0)
idum2 += IM2;
j=iy/NDIV;
iy=iv[j]-idum2;
iv[j] = *idum;
if (iy < 1)
iy += IMM1;
if ((temp=AM*iy) > RNMX)
return RNMX;
else
return temp;
}
我需要并行化程序。
您的代码有几个问题。
首先,您将 x
、y
和 z
的未初始化值传递给每个带有 firstprivate
的 OpenMP 线程,编译器会发出警告.通过将声明移到 for
循环并删除 firstprivate
可以很容易地解决这个问题。同样的道理,i
应该是private
.
seed
应该在每次迭代期间保持不变,但由于它是一个共享变量,线程正在竞争将它们的值写入它。这也可以通过将 seed
的声明移到循环中来解决。
第三个问题是线程在写入count
时也在竞速。因为你想总结来自不同线程的值,你应该使用 reduction(+:count)
指令。
第四,ran2
函数不是thread-safe。它具有 idum2
、iy
和 iv
形式的静态状态,其中线程再次竞争。解决此问题的最佳方法是通过将其移动到作为参数传递的 struct ran_state
(见下文)来摆脱全局状态。然后将每个引用 idum2
的地方替换为 state->idum2
,将 iy
替换为 iy
,将 state->iv
替换为 state->iv
。最后,在 for
循环之前创建并初始化这个状态,并将其标记为 firstprivate
这样每个线程都有自己的初始化状态。
这看起来如下(为方便起见在一个文件中):
#include <stdlib.h>
#include <stdio.h>
// Insert the #defines for ran2 here ...
struct ran_state {
long idum2;
long iy;
long iv[NTAB];
};
// Insert ran2 here, replacing iv with state->iv, and so on ...
int main(int argc, char **argv){
int niter, i;
double count;
double pi;
niter=10000;
count=0;
struct ran_state state = { 123456789, 0, {0} };
#pragma omp parallel for reduction(+:count) firstprivate(state) private(i) num_threads(4)
for(i=1;i<=niter;i++){
double x, y, z;
long seed;
seed=i;
x=ran2(&seed, &state);
y=ran2(&seed, &state);
z=x*x+y*y;
if(z<1){
count+=1;
}
}
pi=count*4.0/niter;
printf("The value of pi is %8.14f\n",pi);
return 0;
}
我尝试将循环并行化,但增加线程数让我只剩下 'Segmentation fault(core dumped)'
我已经并行化了 main.c 中的循环,该循环在内部引用了 ran2.c 文件函数,这在某处导致了分段错误,我需要并行化程序的帮助。
main.c:
#include <stdlib.h>
#include <stdio.h>
int main(int argc, char **argv) {
int niter, i, j;
long seed;
double count;
double x,y,z,pi;
extern float ran2();
niter=10000;
count=0;
#pragma omp parallel firstprivate(x, y, z, i) shared(count) num_threads(4)
for(i=1; i<=niter; i++) {
seed=i;
x=ran2(&seed);
y=ran2(&seed);
z=x*x+y*y;
if(z<1) {
count+=1;
}
}
pi=count*4.0/niter;
printf("The value of pi is %8.14f\n",pi);
return 0;
}
ran2.c
#define IM2 2147483399
#define IM1 2147483563
#define AM (1.0/IM1)
#define IMM1 (IM1-1)
#define IA1 40014
#define IA2 40692
#define IQ1 53668
#define IQ2 52774
#define IR1 12211
#define IR2 3791
#define NTAB 32
#define NDIV (1+IMM1/NTAB)
#define EPS 1.2e-7
#define RNMX (1.0-EPS)
float ran2(long *idum) {
int j;
long k;
static long idum2=123456789;
static long iy=0;
static long iv[NTAB];
float temp;
if (*idum <= 0) {
if (-(*idum) < 1)
*idum=1;
else *idum = -(*idum);
idum2=(*idum);
for (j=NTAB+7; j>=0; j--) {
k=(*idum)/IQ1;
*idum=IA1*(*idum-k*IQ1)-k*IR1;
if (*idum < 0)
*idum += IM1;
if (j < NTAB)
iv[j] = *idum;
}
iy=iv[0];
}
k=(*idum)/IQ1;
*idum=IA1*(*idum-k*IQ1)-k*IR1;
if (*idum < 0)
*idum += IM1;
k=idum2/IQ2;
idum2=IA2*(idum2-k*IQ2)-k*IR2;
if (idum2 < 0)
idum2 += IM2;
j=iy/NDIV;
iy=iv[j]-idum2;
iv[j] = *idum;
if (iy < 1)
iy += IMM1;
if ((temp=AM*iy) > RNMX)
return RNMX;
else
return temp;
}
我需要并行化程序。
您的代码有几个问题。
首先,您将 x
、y
和 z
的未初始化值传递给每个带有 firstprivate
的 OpenMP 线程,编译器会发出警告.通过将声明移到 for
循环并删除 firstprivate
可以很容易地解决这个问题。同样的道理,i
应该是private
.
seed
应该在每次迭代期间保持不变,但由于它是一个共享变量,线程正在竞争将它们的值写入它。这也可以通过将 seed
的声明移到循环中来解决。
第三个问题是线程在写入count
时也在竞速。因为你想总结来自不同线程的值,你应该使用 reduction(+:count)
指令。
第四,ran2
函数不是thread-safe。它具有 idum2
、iy
和 iv
形式的静态状态,其中线程再次竞争。解决此问题的最佳方法是通过将其移动到作为参数传递的 struct ran_state
(见下文)来摆脱全局状态。然后将每个引用 idum2
的地方替换为 state->idum2
,将 iy
替换为 iy
,将 state->iv
替换为 state->iv
。最后,在 for
循环之前创建并初始化这个状态,并将其标记为 firstprivate
这样每个线程都有自己的初始化状态。
这看起来如下(为方便起见在一个文件中):
#include <stdlib.h>
#include <stdio.h>
// Insert the #defines for ran2 here ...
struct ran_state {
long idum2;
long iy;
long iv[NTAB];
};
// Insert ran2 here, replacing iv with state->iv, and so on ...
int main(int argc, char **argv){
int niter, i;
double count;
double pi;
niter=10000;
count=0;
struct ran_state state = { 123456789, 0, {0} };
#pragma omp parallel for reduction(+:count) firstprivate(state) private(i) num_threads(4)
for(i=1;i<=niter;i++){
double x, y, z;
long seed;
seed=i;
x=ran2(&seed, &state);
y=ran2(&seed, &state);
z=x*x+y*y;
if(z<1){
count+=1;
}
}
pi=count*4.0/niter;
printf("The value of pi is %8.14f\n",pi);
return 0;
}