gpgpu
-
为什么使用计算能力 1.3 的简单 RGB 到 Lab 转换比 1.0 慢得多,即使使用 -use_fast_math 标志?
-
Cuda PTX 寄存器声明和使用
-
GCC 中的 OpenMP 4.0:卸载到 nVidia GPU
-
clGetDeviceInfo 和 clGetPlatformInfo 在 OpenCL 中失败,错误代码为 -30 (CL_INVALID_VALUE)
-
iOS Metal:无法使用函数创建计算管道状态
-
从 arrayfire 数组中检索值作为标准类型和序列化
-
在 CUDA 计算能力 3.5+ 中,所有线程(在 SM 上)真的每个线程都有 255 个寄存器吗?
-
编译不支持 c++11 的 cuda 代码和 .cxx 文件需要带有 vexcl 示例的 c++11
-
cudamallocmanaged 是否足够聪明,不会复制不需要的数据?
-
CUDA/thrust 中分段数据的成对运算
-
用于通用 GPU 的控制台上的 openCL?
-
是否可以说哪个指针由 cudaMalloc 分配,哪个由 malloc 分配?
-
Pycuda 向量算法 - 内核中的 Id
-
在 opencl 中使用 cpu 设备访问文件系统
-
gpu 内核在完成一个任务后会切换任务吗?
-
无法在 linux 中生成 gpg 密钥
-
使用 CUDA 合并对二维数组的内存访问
-
推力:reduce_by_key 比预期慢
-
使用 Thrust 在 Cuda 中对二维数组进行排序
-
sort_by_key in thrust 是阻塞调用吗?