甚至在执行 `main()` 的第一行之前就出现分段错误,并且没有非局部变量

Segmentation Fault before even the first line of `main()` is executed and there are no non-local variables

在下面的 C++ 代码中,在执行 main() 的第一行之前发生段错误。
即使在输入 main() 之前没有要构造的对象,也会发生这种情况,如果我在 [=14] 的第二行删除一个(大)变量定义,它确实 而不是 发生=].

我假设发生分段错误是因为定义的变量的大小。我的问题是为什么会在 before the prior line is executed?

由于优化器对指令重新排序,这似乎不应该发生。我是根据选择的编译选项和调试输出说的。
正在定义的(数组)变量的大小是否会破坏堆栈/导致段错误?
看起来是这样,因为使用较小的数组(例如 15 个元素)不会导致分段错误,并且可以看到标准输出的预期输出。

#include <array>
#include <iostream>
#include <vector>

using namespace std;

namespace {
using indexes_t = vector<unsigned int>;
using my_uint_t = unsigned long long int;

constexpr my_uint_t ITEMS{ 52 };
constexpr my_uint_t CHOICES{ 5 };
static_assert(CHOICES <= ITEMS, "CHOICES must be <= ITEMS");

constexpr my_uint_t combinations(const my_uint_t n, my_uint_t r)
{
    if (r > n - r)
        r = n - r;

    my_uint_t rval{ 1 };

    for (my_uint_t i{ 1 }; i <= r; ++i) {
        rval *= n - r + i;
        rval /= i;
    }

    return rval;
}

using hand_map_t = array<indexes_t, combinations(ITEMS, CHOICES)>;

class dynamic_loop_functor_t {
private:
    // std::array of C(52,5) = 2,598,960 (initially) empty vector<unsigned int>
    hand_map_t hand_map;
};
}

int main()
{
    cout << "Starting main()..." << endl
         << std::flush;

    // "Starting main()..." is not printed if and only if the line below is included.
    dynamic_loop_functor_t dlf;

    // The same result occurs with either of these alternatives:
    // array<indexes_t, 2598960> hand_map;
    // indexes_t hand_map[2598960];
}
g++ -std=c++14 -Wall -Wpedantic -Og -g -o create_hand_map create_hand_map.cpp

编译时不会生成错误或警告。

静态分析:

通过 cppcheck 进行的静态分析不会产生意外结果。 按照下面命令输出中的建议使用 check-config 只会产生:Please note: Cppcheck does not need standard library headers to get proper results.

$ cppcheck --enable=all create_hand_map.cpp
create_hand_map.cpp:136:27: style: Unused variable: dlf [unusedVariable]
   dynamic_loop_functor_t dlf;
                          ^
nofile:0:0: information: Cppcheck cannot find all the include files (use --check-config for details) [missingIncludeSystem]

尝试使用 GDB 进行调试:

$ gdb ./create_hand_map
GNU gdb (GDB) Red Hat Enterprise Linux 8.0.1-36.el7
<snip>
This GDB was configured as "x86_64-redhat-linux-gnu".
<snip>
Reading symbols from ./create_hand_map...done.
(gdb) run
Starting program: ./create_hand_map

Program received signal SIGSEGV, Segmentation fault.
0x0000000000400894 in std::operator<< <std::char_traits<char> > (__s=0x4009c0 "Starting main()...",
    __out=...) at /opt/rh/devtoolset-7/root/usr/include/c++/7/ostream:561
561             __ostream_insert(__out, __s,
(gdb) bt
#0  0x0000000000400894 in std::operator<< <std::char_traits<char> > (
    __s=0x4009c0 "Starting main()...", __out=...)
    at /opt/rh/devtoolset-7/root/usr/include/c++/7/ostream:561
#1  main () at create_hand_map.cpp:133
(gdb)

这绝对是堆栈溢出。 sizeof(dynamic_loop_functor_t) 接近 64 MiB,大多数 Linux 发行版的默认堆栈大小限制仅为 8 MiB。所以崩溃并不奇怪。

剩下的问题是,为什么调试器将崩溃识别为来自内部 std::operator<<?实际的段错误是由第一条访问超出堆栈限制的地址的指令引发的 CPU 异常引起的。调试器仅获取错误指令的地址,并且必须使用编译器提供的调试信息将其与特定的源代码行相关联。

这个过程的结果并不总是直观的。指令和源代码行之间并不总是有明确的对应关系,尤其是当优化器可能对指令重新排序或组合来自不同行的代码时。此外,在许多情况下,一个源代码行的错误或问题可能会导致另一段无辜的代码出现错误。因此,调试器显示的源代码行应始终持保留态度。

在这种情况下,发生的事情如下。

  • 编译器决定所有局部变量需要的栈总量space,并在函数最开始的栈指针中减去这个数进行分配,在 prologue。这比在声明时为每个局部变量单独分配更有效。 (请注意,构造函数(如果有的话)直到​​代码中变量声明实际出现的位置才会被调用。)

    序言代码通常不与任何特定的源代码行关联,或者可能与包含函数开头的行关联 {。但无论如何,从栈指针中减去是一个纯粹的寄存器操作;它不访问内存,因此不会自行导致段错误。尽管如此,堆栈指针现在指向为堆栈映射的区域之外,因此下一次尝试访问堆栈指针附近的内存将出现段错误。

  • main 的下几条指令执行 cout << "Starting main"。这在概念上是对标准库中重载的 operator<< 的调用;但在 GCC 的 libstdc++ 中,operator<< 是一个非常短的函数,它只调用名为 __ostream_insert 的内部辅助函数。由于它太短了,编译器决定将 operator<< 内联到 main 中,因此 main 实际上包含对 __ostream_insert 的调用。这是出错的指令:x86 call 指令将 return 地址压入堆栈,并且堆栈指针,如前所述,超出范围。

    现在设置参数和调用 __ostream_insert 的指令在 <ostream> 头文件中被调试信息标记为对应于 operator<< 的源代码——即使那些说明已内联到 main。因此,您的调试器显示崩溃发生在“内部”operator<<.

    如果编译器没有内联 operator<<(例如,如果您在没有优化的情况下编译),那么 main 将包含对 operator<< 的实际调用,而这个调用就是坠毁。在那种情况下,回溯将指向 main 本身中的 cout << "Starting main" 行 - 以不同的方式误导。


请注意,您可以使用 -Wstack-usage=NNN-Wframe-larger-than=NNN 选项让 GCC 警告您有关使用大量堆栈的函数。 -Wall 未启用这些,但添加到您的构建中可能很有用,尤其是当您希望使用大型本地对象时。指定它们中的任何一个,并为 NNN 指定一个合理的数字(比如 4000000),我在你的 main 函数上收到警告。