编译器如何使用编译器生成的临时文件确定函数所需的堆栈大小?

How does the compiler determine the needed stack size for a function with compiler generated temporaries?

考虑以下代码:

class cFoo {
    private:
        int m1;
        char m2;
    public:
        int doSomething1();
        int doSomething2();
        int doSomething3();
}

class cBar {
    private:
        cFoo mFoo;
    public:
        cFoo getFoo(){ return mFoo; }
}

void some_function_in_the_callstack_hierarchy(cBar aBar) {
    int test1 = aBar.getFoo().doSomething1();
    int test2 = aBar.getFoo().doSomething2();
    ...
}

在调用 getFoo() 的行中,编译器将生成 cFoo 的临时对象,以便能够调用 doSomething1()。 编译器是否重用用于这些临时对象的堆栈内存? "some_function_in_the_callstack_hierarchy" 的调用会保留多少栈内存?它是否为每个生成的临时文件保留内存?

我的猜测是编译器只为 cFoo 的一个对象保留内存,并且会为不同的调用重用内存,但是如果我添加

    int test3 = aBar.getFoo().doSomething3();

我可以看到 "some_function_in_the_callstack_hierarchy" 所需的堆栈大小要多得多,这不仅仅是因为额外的本地 int 变量。

另一方面,如果我再替换

cFoo getFoo(){ return mFoo; }

带有引用(仅用于测试目的,因为返回对私有成员的引用不好)

const cFoo& getFoo(){ return mFoo; }

它需要的堆栈内存比一个 cFoo 的大小要少得多。

所以对我来说,编译器似乎为函数中每个生成的临时对象保留了额外的堆栈内存。但这将是非常低效的。 有人可以解释一下吗?

optimizing compiler 正在将您的源代码转换为某种内部表示,并对其进行规范化。

使用 free software compilers (like GCC & Clang/LLVM),您可以查看该内部表示(至少通过修补编译器代码或在某些调试器中 运行 它)。

顺便说一句,有时,临时值甚至不需要任何堆栈 space,例如因为它们已经过优化,或者因为它们可以放在寄存器中。而且他们经常会在当前调用帧中重用一些不需要的槽。此外(特别是在 C++ 中)许多(小的)函数是 inlined -like your getFoo probably is- (so they don't have any call frame themselves). Recent GCC are even sometimes able of tail-call 优化(本质上,重用调用者的调用框架)。

如果您使用 GCC 编译(即 g++),我建议使用 optimization options and developer options (and some others). Perhaps use also -Wstack-usage=48(或其他一些值,以每个调用帧的字节数为单位)and/or -fstack-usage

首先,如果你可以阅读汇编代码,用 g++ -S -fverbose-asm -O yourcode.cc 编译 yourcode.cc 并查看发出的 yourcode.s

(不要忘记使用优化标志,所以将 -O 替换为 -O2-O3 ....)

然后,如果您对编译器如何优化更好奇,请尝试 g++ -O -fdump-tree-all -c yourcode.cc,您会得到很多所谓的 "dump files",其中包含一个 partial 与 GCC 相关的内部表示的文本呈现。

如果您更好奇,请查看我的 GCC MELT and notably its documentation 页面(其中包含 大量 幻灯片和参考资料)。

So for me it seems that the compiler reserves extra stack memory for every generated temporary object in the function.

当然不是,在一般情况下(当然假设您启用了一些优化)。即使保留了一些 space,它也会很快被重用。

顺便说一句:请注意,C++11 标准并未提及堆栈。人们可以想象一些 C++ 程序在不使用任何堆栈的情况下编译(例如,整个程序优化检测一个没有递归的程序,其堆栈 space 和布局可以优化以避免任何堆栈。我不知道任何这样的编译器,但我知道编译器可以很聪明....)

随着优化策略变得更加积极,试图分析如何编译器将处理一段特定的代码变得越来越困难。

编译器所要做的就是实现 C++ 标准并在不引入或取消任何副作用的情况下编译代码(有一些例外,例如 return 和命名 return 值优化)。

你可以从你的代码中看到,由于 cFoo 不是多态类型并且没有成员数据,编译器可以完全优化对象的创建并调用本质上因此 static 直接运行。我想即使在我撰写本文时,一些编译器已经在这样做了。您可以随时检查输出程序集以确定。

编辑:OP 现已引入 class 成员。但是由于这些从未被初始化并且是 private,编译器可以删除它们而不用考虑太多。因此,这个答案仍然适用。

临时对象的生命周期到完整包含表达式的结束为止,请参阅标准的“12.2 临时对象”段落。

即使使用最低的优化设置,编译器也不太可能在临时对象生命周期结束后不重用 space。