我如何在 OpenACC 中找到帮派的 ID?
How can I find the id of a gang in OpenACC?
在 OpenMP 中,我可以使用 omp_get_thread_num()
获取执行代码的线程的数字 ID。
我可以在 OpenACC 中使用类似的函数来获取执行一段代码的帮派 ID 吗?
OpenACC 标准还没有包含这样的函数,但是,通过 PGI 编译器,您可以使用编译器扩展函数 __pgi_gangidx()
,如下所示:
//pgc++ -fast -acc -ta=tesla,cc60 -Minfo=accel test.cpp
#include <iostream>
#include "openacc.h"
int main(){
int gangs = 100;
int *ids = new int[gangs];
//Ensure everything is zeroed
for(int i=0;i<gangs;i++)
ids[i] = 0;
#pragma acc parallel num_gangs(gangs) copyout(ids[0:gangs])
{
ids[__pgi_gangidx()] = __pgi_gangidx();
}
for(int i=0;i<gangs;i++)
std::cout<<ids[i]<<" ";
std::cout<<std::endl;
}
编译:
pgc++ -fast -acc -ta=tesla,cc60 -Minfo=accel test.cpp
输出为:
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99
符合预期。
提供了一套附加功能:
extern int __pgi_gangidx(void);
extern int __pgi_workeridx(void);
extern int __pgi_vectoridx(void);
extern int __pgi_blockidx(int);
extern int __pgi_threadidx(int);
请注意,omp_get_thread_num()
不适用于(目前?)针对 GPU 的代码。
在 OpenMP 中,我可以使用 omp_get_thread_num()
获取执行代码的线程的数字 ID。
我可以在 OpenACC 中使用类似的函数来获取执行一段代码的帮派 ID 吗?
OpenACC 标准还没有包含这样的函数,但是,通过 PGI 编译器,您可以使用编译器扩展函数 __pgi_gangidx()
,如下所示:
//pgc++ -fast -acc -ta=tesla,cc60 -Minfo=accel test.cpp
#include <iostream>
#include "openacc.h"
int main(){
int gangs = 100;
int *ids = new int[gangs];
//Ensure everything is zeroed
for(int i=0;i<gangs;i++)
ids[i] = 0;
#pragma acc parallel num_gangs(gangs) copyout(ids[0:gangs])
{
ids[__pgi_gangidx()] = __pgi_gangidx();
}
for(int i=0;i<gangs;i++)
std::cout<<ids[i]<<" ";
std::cout<<std::endl;
}
编译:
pgc++ -fast -acc -ta=tesla,cc60 -Minfo=accel test.cpp
输出为:
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99
符合预期。
提供了一套附加功能:
extern int __pgi_gangidx(void);
extern int __pgi_workeridx(void);
extern int __pgi_vectoridx(void);
extern int __pgi_blockidx(int);
extern int __pgi_threadidx(int);
请注意,omp_get_thread_num()
不适用于(目前?)针对 GPU 的代码。