澄清与 PCI Express 插槽传输速率相关的 GPU 带宽 (v1.x - x16)

Clarification on GPU bandwidth in relation to PCI Express slots transfer rate (v1.x - x16)

只需要说明 GPU 带宽与 PCI Express 传输速率的关系。它将帮助我了解图形卡的实际工作原理...

所以要计算带宽:

Memory Speed x Bus Width / 8 = Bandwidth (B/s)

因此,如果我的显卡总线宽度为 256 位并且内存速度在 GDDR3 上为 900MHz:

Bandwidth = 900MHz * 256 / 8 = 28GB/s (28GB/s * 2 = 57GB/s because GDDR3 is double data rate)

PCI Express v1.0 上的单个通道的传输速率为 250MB/s,因此 16 个通道将为 4GB/s。

让我困惑的是,接口(PCIe)的传输速率为4GB/s,而显卡的传输速率为57GB/s。

问题:那么这不会因为接口只能传输4GB/s而造成瓶颈吗?

您已经正确识别出显卡的内存速度明显高于它与外部设备(尤其是系统 RAM)通信的速度。

从主内存加载数据(GPGPU)或纹理(3D渲染)到GPU内存是比较慢的,这在业界是众所周知的。一旦数据存储在 GPU 的内存中,更高的内部带宽使 GPU 的计算单元能够有效地工作并提供比 CPU.

更高的性能。