什么是真正的分享?
What is true sharing?
在阅读问题时,我遇到了“虚假分享”和“真实分享”这两个词。我读过什么是虚假分享,但我找不到任何关于真实分享的内容。虽然在提到的问题中这个词被描述为“建设性干涉”,但我仍然不明白它是什么意思。
真正的共享是一个核心访问多个附近的内存地址,这些地址已加载到单个缓存行中。第一次访问后的每次访问都受益于缓存。
这是我从硬件设计角度理解的真共享和假共享。如果我错了请纠正我。
核心在访问变量时加载一块内存,以减少内存访问时间。在多核系统中,要保持这些“缓存行”之间的一致性。即使这样,缓存未命中也可能由于多种原因而发生,其中两个是两种类型的数据共享的结果。
一个“真正的数据共享”,其中两个核心,试图访问和修改同一个词,导致另一个核心中的缓存行不断失效。
假设高速缓存行大小为 2 个字,核心 0 和核心 1 正在尝试修改地址 0x100。假设字节存储,2字缓存行大小意味着0x100~0x108将被加载到核心0和核心1的缓存中。现在当核心0修改0x100处的数据时,缓存行incore 1无效。当核心 1 修改 0x100 处的数据时,它必须使用核心 0 缓存中的数据更新其缓存行,并且核心 0 中的缓存行无效。之后它将写入 0x100。现在,如果这是循环发生的,那么缓存维护会浪费大量带宽。这是由于 True Sharing 导致的高速缓存未命中,其中核心之间存在数据字的“真正共享”。
第二种是“虚假共享数据”,其中两个核心尝试访问和修改同一缓存行中的两个不同字,导致另一个核心中的缓存行不断失效。以前面的例子为例,假设核心 0 想要修改 0x100,核心 2 想要修改 0x104。现在,当核心 0 修改 0x100 处的数据时,核心 1 缓存行将失效。当核心 1 修改 0x104 处的数据时,它必须使用核心 0 缓存中的数据更新其缓存行,并且核心 0 中的缓存行无效。之后它将写入 0x104。在循环中完成时,这也会导致性能损失。这里的性能损失是由于两个内核之间数据的“错误共享”。
据我理解,true sharing是指多核频繁写入同一个共享变量的问题,而false sharing指的是多核写入不同的变量在同一个cache行
在这两种情况下,缓存必须经常失效才能加载最新版本,但真正的共享不能通过例如修复。添加填充以确保两个变量位于不同的缓存行。
参考文献:
在阅读
真正的共享是一个核心访问多个附近的内存地址,这些地址已加载到单个缓存行中。第一次访问后的每次访问都受益于缓存。
这是我从硬件设计角度理解的真共享和假共享。如果我错了请纠正我。
核心在访问变量时加载一块内存,以减少内存访问时间。在多核系统中,要保持这些“缓存行”之间的一致性。即使这样,缓存未命中也可能由于多种原因而发生,其中两个是两种类型的数据共享的结果。
一个“真正的数据共享”,其中两个核心,试图访问和修改同一个词,导致另一个核心中的缓存行不断失效。 假设高速缓存行大小为 2 个字,核心 0 和核心 1 正在尝试修改地址 0x100。假设字节存储,2字缓存行大小意味着0x100~0x108将被加载到核心0和核心1的缓存中。现在当核心0修改0x100处的数据时,缓存行incore 1无效。当核心 1 修改 0x100 处的数据时,它必须使用核心 0 缓存中的数据更新其缓存行,并且核心 0 中的缓存行无效。之后它将写入 0x100。现在,如果这是循环发生的,那么缓存维护会浪费大量带宽。这是由于 True Sharing 导致的高速缓存未命中,其中核心之间存在数据字的“真正共享”。
第二种是“虚假共享数据”,其中两个核心尝试访问和修改同一缓存行中的两个不同字,导致另一个核心中的缓存行不断失效。以前面的例子为例,假设核心 0 想要修改 0x100,核心 2 想要修改 0x104。现在,当核心 0 修改 0x100 处的数据时,核心 1 缓存行将失效。当核心 1 修改 0x104 处的数据时,它必须使用核心 0 缓存中的数据更新其缓存行,并且核心 0 中的缓存行无效。之后它将写入 0x104。在循环中完成时,这也会导致性能损失。这里的性能损失是由于两个内核之间数据的“错误共享”。
据我理解,true sharing是指多核频繁写入同一个共享变量的问题,而false sharing指的是多核写入不同的变量在同一个cache行
在这两种情况下,缓存必须经常失效才能加载最新版本,但真正的共享不能通过例如修复。添加填充以确保两个变量位于不同的缓存行。
参考文献: