我可以使用 CUDA CUB 迭代器而不是推力吗?

May I use CUDA CUB iterator instead of thrust?

是否可以像 Thrust 一样在 CUB 中使用迭代器? 我想使用 CUB 而不是推力,如下所示:

__global__ void reduce_roster(thrust::device_vector<float>::iterator vect, float * tab_seq, int SEUIL_ROSTER)
{
    int tid = blockIdx.x * blockDim.x + threadIdx.x;
    float resultat = 0;

    int i = TAILLE_ROSTER/TAILLE_SEQ_ROSTER;
    resultat = thrust::reduce(thrust::device, vect + (tid * TAILLE_ROSTER) + TAILLE_SEQ_ROSTER *  (i - 1), vect + (tid * TAILLE_ROSTER) + TAILLE_SEQ_ROSTER * i);


    float tmp;
    i--;

    while (resultat != -1 && i != 0)
    {
        if (resultat > SEUIL_ROSTER)
        {
            resultat = -1; 
        }
        else
        {               

            tmp = thrust::reduce(thrust::device, vect + (tid * TAILLE_ROSTER) + TAILLE_SEQ_ROSTER *  (i - 1), vect + (tid * TAILLE_ROSTER) + TAILLE_SEQ_ROSTER * i);

            resultat = resultat + tmp;


            i--;
        }
    }

由于 CUB 比 trust 快,所以我试图用它来减少数组的段。

没有

除此之外,也无法使用 CUB 执行您在代码中显示的相同操作。根据您编译内核的方式,thrust 将发出代码,其中减少由每个线程串行执行,或者由使用动态并行性的子内核启动。另一方面,CUB 具有 warp 和块范围设备缩减功能。它不支持单线程或动态并行范围操作。