如何保护寄存器在函数调用期间不被覆盖?

How can one protect a register from being overwritten during a function call?

我正在尝试为以下函数编写汇编代码:

#include <iostream>
void f(int x) {
    if (x > 0) {
        std::cout << x << std::endl;
        f(x-1);
        std::cout << x << std::endl;
    }
}
int main() {
    f(1);
}

这个函数脚本的输出是1 1。我尝试为所谓的“低成本计算机”汇编器编写汇编代码,这是 Anthony Dos Reis 为他的书“C and C++ under the hood”发明的计算机。我写的汇编代码是:

startup   jsr main
          halt             ; back to operating system
;==============================================================
                           ; #include <stdio.h>
greater   dout
          nl
          sub r1, r0, 1
          push lr
          push fp
          mov fp, sp
          push r1
          jsr f
          add sp, sp, 1
          dout
          nl
          mov sp, fp
          pop fp
          pop lr
          ret
;==============================================================
f         push lr          ; int f()
          push fp          ; {
          mov fp, sp
          ldr r0, fp, 2
          cmp r0, 0
          brgt greater
          mov sp, fp
          pop fp
          pop lr
          ret
;==============================================================
main      push lr
          push fp
          mov fp, sp
          mov r0, 1
          push r0
          jsr f
          add sp, sp, 1
          mov sp, fp
          pop fp
          pop lr
          ret

代码将 1 0 打印到标准输出,显然是错误的。错误输出的原因在于寄存器 r0 在跳转到函数 f 之前在计算分支 greater 期间包含 1,然后是函数f修改寄存器,在做比较cmp时将r0设置为0。这让我想知道汇编器如何在函数调用期间保持寄存器不变。我想到了以下几点:

  1. 只需将整个寄存器压入堆栈,然后再次加载
  2. 通过某种方式收集函数调用的内容,然后在需要时“保护”寄存器。

我认为解决方案 1 是非常防御性的并且可能成本很高,而解决方案 2 可能很复杂并且需要很多知识。最有可能的是,我只是在编写程序集时犯了一个错误,但我仍然不明白汇编程序如何在一般情况下需要时保持其寄存器不变,或者如何解决上述问题。有人知道在这种情况下该怎么办吗?我很感激任何帮助或建议!

通常,计算平台包括一个应用程序二进制接口 (ABI),它指定函数调用的协议等。 ABI 指定某些处理器寄存器用于传递参数或 return 结果,某些寄存器可由被调用例程自由使用(暂存或易失性寄存器),某些寄存器可由被调用例程使用但必须恢复到它们的原始值(保留或非易失性寄存器),and/or 某些寄存器不能被调用的例程更改。关于调用例程的规则也可以称为“调用约定”。

如果您的例程使用被调用函数可以自由使用的寄存器之一,并且它希望在函数调用期间保留该寄存器的值,则它必须在函数调用之前保存它并在之后恢复它。

一般来说,ABI 和函数在它们使用的寄存器中寻求平衡。如果 ABI 说所有寄存器都必须保存和恢复,那么被调用的函数就必须保存和恢复它使用的每个寄存器。相反,如果 ABI 表示不需要保存和恢复寄存器,则调用函数必须保存和恢复它需要的每个寄存器。通过混合,调用例程可能经常将其某些数据保存在保留的寄存器中(因此它不必在调用前保存它们并在调用后恢复它们),并且被调用例程不会使用它必须使用的所有寄存器保留(因此它不必保存和恢复它们;它使用临时寄存器代替),因此减少了执行的寄存器保存和恢复的总数。

Architecture/Platform 组合,例如 Windows-on-x64 或 Linux-on-ARM32,具有所谓的 ABI 或应用程序二进制接口。

ABI 精确指定了寄存器的使用方式、函数的调用方式、异常的工作方式以及函数参数的传递方式。其中一个重要方面是,在函数调用过程中,必须保存哪些寄存器,由谁保存,哪些寄存器可能会被销毁。

可以在函数调用期间销毁的寄存器称为易失性寄存器。函数调用必须保留的寄存器称为 非易失性寄存器 。通常,如果调用者想要保留一个 volatile 寄存器,它会将值压入堆栈,调用函数,然后在完成后将其弹出。如果一个被调用函数(被调用者)想要使用一个非易失性寄存器,它必须类似地保存它。

阅读Windows x64 calling convention here.

正如其他人所说,通常每个寄存器都通过称为调用约定的协议分配一个使用模型。有几种使用模式:

  • Call clobbered — 有时也称为“scratch”,这些寄存器被理解为被函数调用破坏,因此,它们可以在调用之间使用,并且可以自由使用通过任何函数。

    有时这些被称为“调用者保存”,因为调用者负责在调用后需要时保留它们的任何值;也称为“挥发性”。然而,实际上,一旦移动到内存中,就不需要恢复它们,直到真正需要它们的值为止;这些值不需要恢复到它们存储到内存时所在的同一寄存器,并且在某些体系结构上,这些值也可以直接从内存中使用。

  • 调用保留 — 这些寄存器被理解为通过函数调用保留,这意味着为了使用其中之一,必须保留寄存器的原始内容(通常在函数入口处)并且稍后恢复(通常在函数退出时)。有时也称为“被调用者保存”,因为调用者可以依赖其值的保存,被调用者必须保存并在使用时恢复它们;也称为非易失性术语。

  • 其他 — 在某些处理器上,某些寄存器专用于参数传递和 return 值;由于这些用途,它们不一定严格按照 call clobbered 或 call preserved 的方式运行——也就是说,它不一定是被调用的函数破坏了它们,但调用者可能需要在仅仅进行调用时破坏它们,即在之前传递的参数中电话。函数可以在调用后需要的这些寄存器中具有形式参数值,但需要在调用另一个函数的指令序列中将实际参数放入其中。发生这种情况时,调用后所需的参数值通常会重新定位(到内存或调用保留的寄存器)。

From somehow gleaning what the function call thus and then "protecting" the registers if it needs to.

这可行。调用约定是一种通用协议,当调用者或被调用者不知道对方的实现细节时,或者当间接函数调用(通过指针调用)可以调用几个不同的实际函数之一时,它特别有用。然而,当被调用者和调用者在实现中都是已知的时,作为一种优化,我们可以偏离标准调用约定。例如,如果我们知道被调用的函数不会修改暂存寄存器,我们可以使用暂存寄存器来保存特定调用中的值。