加载或存储可以在有条件之前重新排序吗?

Can a load or store be reordered before a conditional?

std::atomic_uint64_t writing_ {0};
std::atomic_uint64_t reading_ {0};
std::array<type, size> storage_ {};

bool try_enqueue(type t) noexcept
{
    const std::uint64_t writing {
        writing_.load(std::memory_order::memory_order_relaxed)};
    const auto last_read {reading_.load(std::memory_order::memory_order_relaxed)};
    if (writing - last_read < size) {
        storage_.at(writing & (size - 1)) = t;
        writing_.store(writing + 1, std::memory_order::memory_order_release);

        return true;
    }
    else
        return false;
}

在上面的代码中,据我了解,如果条件评估为假,则任何线程都不可能观察到对共享存储的写入。一个操作不能被认为是在它排序之后的条件之前发生的,这是否正确?还是我完全误读了这一点,这样的事情实际上可能会发生(也许是通过推测执行?)?

更具体一点,处理器是否可以推测性地执行写入(当条件最终评估为 false 时),另一个线程观察写入是否已发生,然后 然后第一个线程丢弃推测性写入?

(注:这是单生产者单消费者)

Is it correct that an operation cannot be perceived as having occurred before a conditional it is sequenced after?

C++ 编译器绝对不允许发明写入 atomic(或 volatile)对象。

编译器甚至不允许发明对非原子对象的写入(例如,将条件写入转换为读取 + cmov + 写入),因为 C++11 引入了一种内存模型,使其为两个线程定义良好到 运行 这样的代码,只要其中最多 实际上 写入(然后读取顺序)。但是两个非原子 RMW 可能会相互踩踏,所以不要像 C++ 抽象机正在 运行 源代码一样工作,所以编译器不能选择发出那样做的 asm .

但是如果编译器知道一个对象总是被写入,它几乎可以做任何它想做的事情,因为合法的程序无法观察到差异:这将涉及数据争用 UB。


A little more specifically, could the processor speculatively execute the write (when the condition will eventually evaluate to false), another thread observe the write as having occurred, and then the first thread discarding the speculative write?

不,推测不会逃脱进行推测的内核。否则当检测到错误推测时,所有内核都必须回滚它们的状态!

这是存在存储缓冲区的主要原因之一:将存储的 OoO 推测性 执行 提交 分离到 L1d 缓存 (这是商店对其他核心全局可见的时候)。并将执行与缓存未命中存储分离,这即使在有序的非推测 CPU 上也很有用。

直到存储指令从无序核心退出(即已知是非推测性的)后,存储才提交给 L1d。尚未提交的退役存储有时被称为“已毕业”,以将它们与其他存储缓冲区条目区分开来,如果核心需要回滚到退役状态,这些条目可能会被丢弃。

这允许硬件推测执行而无需发明写入。

(另请参阅 以获取更多详细信息。有趣的事实:一些 CPU,特别是 PowerPC,可以在同一物理内核上的 SMT 线程之间进行分级存储的存储转发,使存储在之前对某些内核可见它们变得全球可见。但仅限于分级商店,否则可能的错误猜测可能会泄露。)


在 C++ 中,std::mo_release 存储强制编译器使用足够的屏障或发布存储指令(例如,x86 上的普通 mov 是发布存储,或 stlr AArch64 上是顺序发布存储)。或者任何其他机制来确保 asm 保证 运行 时间排序 至少 与 C++ 抽象机保证一样强。

C++ 根据前/后顺序定义其标准,而不是障碍,但在任何给定的平台实现上/ABI 对从 std::atomic 操作到 asm 序列的某些映射进行标准化。 (例如 https://www.cl.cam.ac.uk/~pes20/cpp/cpp0xmappings.html