嵌套范围如何影响堆栈深度?

How do nested scopes affect stack depth?

我尝试使用 (CL TestFile.c /Fa /Ot) 和未优化 (CL TestFile.c /Fa) 将以下 C 代码使用 MSVC 编译成汇编,结果是它们产生相同的堆栈深度。

当编译器知道最多使用 16 个字节时,为什么它为 x、y 和 3 个变量中的每一个使用 8 个字节?它不能使用 y = 4z = 8 而不是 y = 4z = 4 所以 yz 在堆栈上使用相同的内存没有任何问题?

int main() {
  int x = 123;
  if (x == 123) {
    int y = 321;
  }
  else {
    int z = 234;
  }
}
; Parts of the assembly code
x$ = 0
y = 4
z = 8
main PROC
$LN5:
  sub rsp, 24
; And so on...

嵌套作用域不影响堆栈深度。根据 C 标准,嵌套作用域会影响标识符的可见性,并且不会对 C 实现如何使用堆栈(如果有的话)施加任何要求。 C 标准允许 C 编译器生成任何具有相同可观察行为的代码。

对于问题中显示的程序,唯一可观察到的行为是以成功状态退出,因此一个好的编译器应该在优化时生成一个最小程序。例如,GCC 10.2 for x86-64 generates just an xor and a ret:

main:
        xor     eax, eax
        ret

Clang 11.0.1 也是如此。如果 MSVC 没有,那就是它的不足。 (但是,开关 /Os/Ot 可能不要求优化或不要求太多优化;当与其他优化开关一起使用时,它们可能只是表达对速度或时间的偏好。 )

此外,一个好的编译器应该对对象的使用进行生命周期分析,构建一个图表来表示节点在代码中的位置,并标记为值的创建或使用,有向边是潜在的程序控制流(或一些源代码的等效表示)。然后应生成汇编程序(或中间代码)以实现图所需的语义。如果两组源代码具有等效图,无论是否使用嵌套范围中的定义,编译器都应为它们生成等效的汇编(或中间代码)(达到处理复杂图的某种合理能力)。