c ++ 11 atomic是否自动解决变量读写上的多核竞争?

Does c++11 atomic automatically solves multi-core race on variable read-write?

我知道当多个线程读写变量时,atomic 会在类型 "T" 变量上应用锁,确保只有其中一个线程在执行 R/W.

但是在多cpu核计算机中,线程可以运行在不同的核上,不同的核会有不同的L1-cache,L2-cache,同时共享L3-cache。我们知道有时C++编译器会优化一个变量存储在寄存器中,这样如果一个变量没有存储在内存中,那么变量上的不同核心缓存之间就没有内存同步。

所以我的 worry/question 是,如果一个原子变量被编译器优化为某个寄存器变量,那么它就不会存储在内存中,当一个核心写入它的值时,另一个核心可能会读出一个过时的值, 正确的?这个数据的一致性有没有保证?

谢谢。

您可能正在寻找这个:

[intro.progress]/18 An implementation should ensure that the last value (in modification order) assigned by an atomic or synchronization operation will become visible to all other threads in a finite period of time.

Atomic 并不像您模糊描述的那样 "solve"。它为基于顺序的内存一致性提供了某些非常具体的保证。

各种编译器在不同平台上以不同方式实现这些保证。

在 x86/64 上,没有锁用于原子整数和达到合理大小的指针。并且硬件提供了比标准要求更强的保证,使得一些更深奥的选项等同于完全一致。

我无法完全回答您的问题,但我可以为您指明正确的方向;您需要了解的主题是 "the C++ memory model".

也就是说,存在原子是为了避免您描述的确切问题。如果您要求完全的内存顺序一致性,并且线程 A 修改 X,然后修改 Y,则没有其他线程可以看到 Y 被修改但 X 看不到。C++ 标准没有指定如何提供这种保证;缓存行失效,使用特殊指令进行访问,禁止编译器进行某些基于寄存器的优化等都是编译器所做的事情。

请注意,C++ 内存模型已针对 C++17 进行了改进、错误修复和完善,以描述新并行算法的行为并允许它们在具有正确标志的 GPU 硬件(以及其他位置)上高效实施,反过来又影响了新 GPU 硬件提供的保证。所以谈论内存模型的人可能会很兴奋并且谈论比您主要关注的 C++11 问题更多的现代问题。

这是一个复杂的大话题。编写您认为可移植的代码真的很容易,但只能在特定平台上运行,或者通常只能在您测试过的平台上运行。但这只是因为线程很难。