OpenGL 原子计数器与 SSBO 中的原子

OpenGL atomic counters vs atomics in a SSBO

我看到这篇文章指出原子计数器缓冲区和 SSBO 中的原子变量之间的性能没有差异:

https://software.intel.com/en-us/articles/opengl-performance-tips-atomic-counter-buffers-versus-shader-storage-buffer-objects

现在 nvidia 和 AMD 的 GPU 真的是这样吗?我想我记得 Radeon 5870 代 GPU 对原子计数器子集有特定更快的支持?所以我认为它可能在某一时刻是 AMD 特定的性能?

根据对 nvidia CUDA 的了解,我怀疑它对他们没有任何影响?

有人知道 AMD/NVidia 原子计数器的哪一代 GPU 不值得吗?

Mantle,AMD 的 low-level API,实际上具有对原子计数器的特定支持(它们是队列的一部分,而不是内存)。因此,我们完全有理由相信,至少有一个硬件不只是为它们使用 SSBO。