单核速度是否受益于巨大的 L3 缓存?

Does single core speed benefit from a huge L3 cache?

假设我有一个 CPU 具有 32 个内核和一个巨大的 120 MB L3 缓存。如果我 运行 一些只在一个内核上执行的内存密集型代码,那么该单个内核是否可以从整个 L3 缓存中受益?据我所知,L3 在大多数现代 x86 CPUs...

内核之间共享

所以我会说是的,它从中受益,但我不确定......这意味着拥有许多具有巨大 L3 缓存的核心 CPU 实际上会加速单核执行对于一些内存繁重的工作负载。

在 AMD Zen 上,不,4 核的每个 CCX(核心集群)都有自己的专用 L3,独立于其他 CCX 中的 L3。

在英特尔 CPU 上,是的。 L3 由 socket/package 中的所有内核共享。拥有许多内核,每个内核都有自己的 L3 切片将意味着更大的环形总线或网格,L3 的 延迟 更高,但容量更大。

如果 8MiB 的 L3 足以满足某些单线程程序的大部分访问,那么它在四核“客户端”i7 芯片上可能 运行 比具有 32 核的大型 Xeon 更快,假设 运行 都处于相同的时钟速度。相关: