CUDA - GB/s 用于 PCI-E 与 Gbps 用于 GPU 的内存时钟速度

CUDA - GB/s for PCI-E vs Gbps for memory clock speed for GPUs

我对 PCI-E 3.0 速度感到震惊:~16 GB/s(每秒千兆字节)相对于顶级 gamma GPU 内存时钟速度(Titan X 列出~10 Gbps,即每秒千兆比特)

所以我们有

PCI-E 3.0    16 GB/s
Titan X      ~1 GB/s

所以问题是:为什么会有这种巨大的差异?他们经常说关于 CUDA,PCI-E 是利用 GPU 能力的最大障碍,但似乎相反:PCI-E 可以处理比 GPU 内存更大的负载(甚至 PCI-E 是~8 GB/s)

我的推理有问题吗?

TITAN X 的 10 gigabit/s memory bandwidth valueper-pin。对于 384 位宽的内存接口,这相当于 480 GB/sec 的总理论峰值内存带宽。对于内存和 PCIe,实际可实现的值约为理论峰值带宽的 80%。