GPU 线程同步多核 CPU 线程与 OpenCL

GPU Thread Synchronization Multi-Core CPU Threads with OpenCL

我一直致力于 GPU 线程与多核 CPU 线程与 OpenCL 的同步。我确实看到了一些 CUDA 示例,但是,如果有人可以就 OpenCL 方面的同步部分给我一些提示,我会更清楚这个概念。在此先感谢您对此事的任何帮助。

David Ehrmann 是正确的消息来源。我只是想补充几个案例:

  • cpu 设备中的障碍非常慢,减速效果甚至超过 cpu 和 gpu 之间的加速比(至少对于中端 amd 桌面 cpu 和低端英特尔手机 cpu)
  • 如果工作组中的 none 个工作项遇到障碍,他们永远不必遇到障碍。一个例子可能是在工作组级别的内核中提前退出,其中以棋盘方式处理(或不处理)图像,这使得交替的工作组处理或不处理。(是的,这是低效的,但更复杂的工作组选择算法可以在编译时一些参数或数据未知的情况下,这种方式很容易)
  • 原子函数不是障碍。他们只是访问一个更新的(通过其他工作项,原子地)内存单元并原子地更新它。