是因为 cpu 乱序执行还是缓存一致性问题需要内存屏障？

Are memory barriers needed because of cpu out of order execution or because of cache consistency problem?

我想知道为什么需要内存屏障，我已经阅读了一些关于这个主题的文章。
有人说是因为 cpu 乱序执行，而 others 说是缓存一致性问题导致存储缓冲区和队列失效。
那么，需要内存屏障的真正原因是什么？ cpu乱序执行或缓存一致性问题？或两者？ cpu乱序执行和缓存一致性有关系吗？ x86和arm有什么区别？

当 ISA 的内存排序规则弱于您的算法所需的语义时，您需要障碍来排序此核心/线程对 globally-visible 连贯缓存的访问。

缓存始终一致，但这与一致性（多个操作之间的排序）不同。

您可以对 in-order CPU 进行内存重新排序。更详细地展示了如何在开始按程序顺序执行指令但具有允许 hit-under-miss and/or 允许 OoO 提交的存储缓冲区。

是因为 cpu 乱序执行还是缓存一致性问题需要内存屏障？

Are memory barriers needed because of cpu out of order execution or because of cache consistency problem?

x86

arm

cpu-architecture

memory-barriers

cpu-cache