我可以使用 CUDA CUB 迭代器而不是推力吗?
May I use CUDA CUB iterator instead of thrust?
是否可以像 Thrust 一样在 CUB 中使用迭代器?
我想使用 CUB 而不是推力,如下所示:
__global__ void reduce_roster(thrust::device_vector<float>::iterator vect, float * tab_seq, int SEUIL_ROSTER)
{
int tid = blockIdx.x * blockDim.x + threadIdx.x;
float resultat = 0;
int i = TAILLE_ROSTER/TAILLE_SEQ_ROSTER;
resultat = thrust::reduce(thrust::device, vect + (tid * TAILLE_ROSTER) + TAILLE_SEQ_ROSTER * (i - 1), vect + (tid * TAILLE_ROSTER) + TAILLE_SEQ_ROSTER * i);
float tmp;
i--;
while (resultat != -1 && i != 0)
{
if (resultat > SEUIL_ROSTER)
{
resultat = -1;
}
else
{
tmp = thrust::reduce(thrust::device, vect + (tid * TAILLE_ROSTER) + TAILLE_SEQ_ROSTER * (i - 1), vect + (tid * TAILLE_ROSTER) + TAILLE_SEQ_ROSTER * i);
resultat = resultat + tmp;
i--;
}
}
由于 CUB 比 trust 快,所以我试图用它来减少数组的段。
没有
除此之外,也无法使用 CUB 执行您在代码中显示的相同操作。根据您编译内核的方式,thrust 将发出代码,其中减少由每个线程串行执行,或者由使用动态并行性的子内核启动。另一方面,CUB 具有 warp 和块范围设备缩减功能。它不支持单线程或动态并行范围操作。
是否可以像 Thrust 一样在 CUB 中使用迭代器? 我想使用 CUB 而不是推力,如下所示:
__global__ void reduce_roster(thrust::device_vector<float>::iterator vect, float * tab_seq, int SEUIL_ROSTER)
{
int tid = blockIdx.x * blockDim.x + threadIdx.x;
float resultat = 0;
int i = TAILLE_ROSTER/TAILLE_SEQ_ROSTER;
resultat = thrust::reduce(thrust::device, vect + (tid * TAILLE_ROSTER) + TAILLE_SEQ_ROSTER * (i - 1), vect + (tid * TAILLE_ROSTER) + TAILLE_SEQ_ROSTER * i);
float tmp;
i--;
while (resultat != -1 && i != 0)
{
if (resultat > SEUIL_ROSTER)
{
resultat = -1;
}
else
{
tmp = thrust::reduce(thrust::device, vect + (tid * TAILLE_ROSTER) + TAILLE_SEQ_ROSTER * (i - 1), vect + (tid * TAILLE_ROSTER) + TAILLE_SEQ_ROSTER * i);
resultat = resultat + tmp;
i--;
}
}
由于 CUB 比 trust 快,所以我试图用它来减少数组的段。
没有
除此之外,也无法使用 CUB 执行您在代码中显示的相同操作。根据您编译内核的方式,thrust 将发出代码,其中减少由每个线程串行执行,或者由使用动态并行性的子内核启动。另一方面,CUB 具有 warp 和块范围设备缩减功能。它不支持单线程或动态并行范围操作。