难以理解“__atomic_compare_exchange”的汇编代码

Difficulties in understand assmbly code of '__atomic_compare_exchange'

我用C++编程,使用CAS操作来进行线程同步

我使用 Vtune 分析了我的程序,发现大部分时间花在了 CAS 操作上。

我看了一下汇编代码

分析结果显示大部分时间花在 'movq %rax, (%rsi)' 上,而不是花在 'lock cmpxchgq %rcx, (%rdi)' 上。

'movq %rax, (%rsi)' 操作与 CAS 操作有什么关系? 此操作正在移动哪些数据?

lock cmpxchgq 花费了很长时间。当探查器确定程序当前所在的位置时,有时必须等待一条指令执行完毕才能找到。这会导致一条长的、不可中断的指令之后的指令被报告为占用大量时间,而实际上是前一条指令如此冗长。

实际上是锁cmpxchg占用了这个时间。 VTune release notes 中提到的以下限制解释了这一点: 运行时间归于下一条指令(200108041)