为什么 RBP 而不是另一个寄存器作为帧指针?

Why RBP instead of another register as a frame pointer?

我理解 push rbp...pop rbp 在函数开始和结束时的用法,以保留调用函数的 rbp 值,因为 rbp 注册是被调用者保留的。然后我理解了 'convention' 使用 rbp 作为当前正在执行的过程的堆栈帧的当前顶部。但是与此相关的我有两个问题:

  1. rbp只是约定俗成吗?我可以像使用 r11 (或任何其他寄存器甚至堆栈上的 8 个字节)一样轻松地用作堆栈帧的基础吗? rbp 寄存器有什么特别之处,还是只是根据历史和惯例用作堆栈框架?
  2. 为什么在离开函数之前将 mov %rbp, %rsp 用作 'cleanup' 方法?例如,通常 push/pop 指令是对称的,所以 mov %rbp, %rsp 只是一种 shorthand 方式,有人可以 'skip' 执行对称的 pops/adds 等等? where mov %rbp, %rsp 的实际用法是什么?几乎每次我在编译器输出中看到它(启用零优化)时,它似乎都是不必要的或多余的,而且我很难想到它可能真正有用的场景。

优化代码根本不使用帧指针,除了像 VLAs / alloca(RSP 的可变大小移动)这样的东西,或者如果你专门使用 -fno-omit-frame-pointer(例如使perf record 堆栈采样更多 efficient/reliable)。未优化的代码通常看起来不那么有趣。

  • (仅针对代码大小)

所以关于何时/为什么使用帧指针的部分有很多重复项。有趣的部分是是否可以选择 RBP 以外的寄存器。


RBP 唯一特别之处在于 leave can compactly do RSP=RBP + pop RBP; and that a (%rbp) (值为 0)。

所以 如果 你要使用帧指针,你应该选择 RBP,因为它至少和任何其他 reg 一样好帧指针,但在某些其他用途上比其他 regs 更差。 你永远不需要 0(frame_pointer),只需要其他偏移量。 (R13 具有相同的 always-needs-a-disp8=0 效果,但是每次堆栈访问总是需要一个 REX 前缀,例如 add -12(%r13), %eax,而 RBP 没有。)

此外,所有其他“传统”寄存器(您可以在没有 REX 的情况下使用,即不是 R8-R15)在 中至少有一个隐式使用,例如 cmpxchg16bcpuidshl %cl, %regrep movsb 或其他,因此任何其他 reg 作为帧指针都会更糟。如果您需要改组以释放 RBX 用于某些需要它用于不同目的的指令,则您不能进行简单的天真未优化(或玩具编译器)代码生成。 (异常情况下的堆栈展开也可能依赖于帧指针 always 在特定的寄存器中,如果你的 .cfi_* 指令指定了这一点。)

与以前的 x86 模式的一致性是使用 RBP 的充分理由,可以让弱小的人的大脑更容易记住,但如果你要使用,仍然有代码大小和其他选择 RBP 的原因一。 (事实上​​ ,由于 (%rsp) 寻址模式总是需要一个 SIB 字节,因此设置帧指针的指令实际上可以在代码大小方面为大型函数付出代价,尽管不是指令/微指令。)


仍然不相关的原因:

RBP 基地址暗示 SS 段,如 RSP,它在 16 位模式下相关,理论上在 32 位模式下(非平坦内存模型是可能的),但在 64 位模式下则不是仅影响您从非规范地址获得的异常。所以这部分原因基本上消失了,几乎没有人关心 #GP#SS 那里。

enter 太慢而无法使用,但如果 R​​SP 尚未指向保存的 RBP,leave 仍然值得使用,与手动 [=29 相比只需要额外花费 1 uop =] / pop %rbp 在 Intel CPU 上,这就是 GCC 所做的。您声称看到了无用的 mov %rbp, %rsp 指令,但实际上编译器并不是这样做的。

请注意 mov %rbp, %rsp(3 个字节)小于 add $imm8, %rsp(4 个字节),因此如果您使用帧指针,您如果 RSP 没有指向保存的 RBP,也可以用这种方式恢复它。 (除非您需要恢复其他寄存器,如果您将它们保存在 RBP 的正下方而不是在 sub $imm, %rsp 之后,尽管您可以使用 mov 加载而不是弹出来进行恢复。)