甚至在执行 `main()` 的第一行之前就出现分段错误,并且没有非局部变量
Segmentation Fault before even the first line of `main()` is executed and there are no non-local variables
在下面的 C++ 代码中,在执行 main()
的第一行之前发生段错误。
即使在输入 main()
之前没有要构造的对象,也会发生这种情况,如果我在 [=14] 的第二行删除一个(大)变量定义,它确实 而不是 发生=].
我假设发生分段错误是因为定义的变量的大小。我的问题是为什么会在 before the prior line is executed?
由于优化器对指令重新排序,这似乎不应该发生。我是根据选择的编译选项和调试输出说的。
正在定义的(数组)变量的大小是否会破坏堆栈/导致段错误?
看起来是这样,因为使用较小的数组(例如 15 个元素)不会导致分段错误,并且可以看到标准输出的预期输出。
#include <array>
#include <iostream>
#include <vector>
using namespace std;
namespace {
using indexes_t = vector<unsigned int>;
using my_uint_t = unsigned long long int;
constexpr my_uint_t ITEMS{ 52 };
constexpr my_uint_t CHOICES{ 5 };
static_assert(CHOICES <= ITEMS, "CHOICES must be <= ITEMS");
constexpr my_uint_t combinations(const my_uint_t n, my_uint_t r)
{
if (r > n - r)
r = n - r;
my_uint_t rval{ 1 };
for (my_uint_t i{ 1 }; i <= r; ++i) {
rval *= n - r + i;
rval /= i;
}
return rval;
}
using hand_map_t = array<indexes_t, combinations(ITEMS, CHOICES)>;
class dynamic_loop_functor_t {
private:
// std::array of C(52,5) = 2,598,960 (initially) empty vector<unsigned int>
hand_map_t hand_map;
};
}
int main()
{
cout << "Starting main()..." << endl
<< std::flush;
// "Starting main()..." is not printed if and only if the line below is included.
dynamic_loop_functor_t dlf;
// The same result occurs with either of these alternatives:
// array<indexes_t, 2598960> hand_map;
// indexes_t hand_map[2598960];
}
- OS: CentOS Linux 发布 7.9.2009(核心)
- 编译器:g++ (GCC) 7.3.1 20180303 (Red Hat 7.3.1-5)
- 编译命令:
g++ -std=c++14 -Wall -Wpedantic -Og -g -o create_hand_map create_hand_map.cpp
编译时不会生成错误或警告。
静态分析:
通过 cppcheck 进行的静态分析不会产生意外结果。
按照下面命令输出中的建议使用 check-config 只会产生:Please note: Cppcheck does not need standard library headers to get proper results.
$ cppcheck --enable=all create_hand_map.cpp
create_hand_map.cpp:136:27: style: Unused variable: dlf [unusedVariable]
dynamic_loop_functor_t dlf;
^
nofile:0:0: information: Cppcheck cannot find all the include files (use --check-config for details) [missingIncludeSystem]
尝试使用 GDB 进行调试:
$ gdb ./create_hand_map
GNU gdb (GDB) Red Hat Enterprise Linux 8.0.1-36.el7
<snip>
This GDB was configured as "x86_64-redhat-linux-gnu".
<snip>
Reading symbols from ./create_hand_map...done.
(gdb) run
Starting program: ./create_hand_map
Program received signal SIGSEGV, Segmentation fault.
0x0000000000400894 in std::operator<< <std::char_traits<char> > (__s=0x4009c0 "Starting main()...",
__out=...) at /opt/rh/devtoolset-7/root/usr/include/c++/7/ostream:561
561 __ostream_insert(__out, __s,
(gdb) bt
#0 0x0000000000400894 in std::operator<< <std::char_traits<char> > (
__s=0x4009c0 "Starting main()...", __out=...)
at /opt/rh/devtoolset-7/root/usr/include/c++/7/ostream:561
#1 main () at create_hand_map.cpp:133
(gdb)
这绝对是堆栈溢出。 sizeof(dynamic_loop_functor_t)
接近 64 MiB,大多数 Linux 发行版的默认堆栈大小限制仅为 8 MiB。所以崩溃并不奇怪。
剩下的问题是,为什么调试器将崩溃识别为来自内部 std::operator<<
?实际的段错误是由第一条访问超出堆栈限制的地址的指令引发的 CPU 异常引起的。调试器仅获取错误指令的地址,并且必须使用编译器提供的调试信息将其与特定的源代码行相关联。
这个过程的结果并不总是直观的。指令和源代码行之间并不总是有明确的对应关系,尤其是当优化器可能对指令重新排序或组合来自不同行的代码时。此外,在许多情况下,一个源代码行的错误或问题可能会导致另一段无辜的代码出现错误。因此,调试器显示的源代码行应始终持保留态度。
在这种情况下,发生的事情如下。
编译器决定所有局部变量需要的栈总量space,并在函数最开始的栈指针中减去这个数进行分配,在 prologue。这比在声明时为每个局部变量单独分配更有效。 (请注意,构造函数(如果有的话)直到代码中变量声明实际出现的位置才会被调用。)
序言代码通常不与任何特定的源代码行关联,或者可能与包含函数开头的行关联 {
。但无论如何,从栈指针中减去是一个纯粹的寄存器操作;它不访问内存,因此不会自行导致段错误。尽管如此,堆栈指针现在指向为堆栈映射的区域之外,因此下一次尝试访问堆栈指针附近的内存将出现段错误。
main
的下几条指令执行 cout << "Starting main"
。这在概念上是对标准库中重载的 operator<<
的调用;但在 GCC 的 libstdc++ 中,operator<<
是一个非常短的函数,它只调用名为 __ostream_insert
的内部辅助函数。由于它太短了,编译器决定将 operator<<
内联到 main
中,因此 main
实际上包含对 __ostream_insert
的调用。这是出错的指令:x86 call
指令将 return 地址压入堆栈,并且堆栈指针,如前所述,超出范围。
现在设置参数和调用 __ostream_insert
的指令在 <ostream>
头文件中被调试信息标记为对应于 operator<<
的源代码——即使那些说明已内联到 main
。因此,您的调试器显示崩溃发生在“内部”operator<<
.
如果编译器没有内联 operator<<
(例如,如果您在没有优化的情况下编译),那么 main
将包含对 operator<<
的实际调用,而这个调用就是坠毁。在那种情况下,回溯将指向 main
本身中的 cout << "Starting main"
行 - 以不同的方式误导。
请注意,您可以使用 -Wstack-usage=NNN
或 -Wframe-larger-than=NNN
选项让 GCC 警告您有关使用大量堆栈的函数。 -Wall
未启用这些,但添加到您的构建中可能很有用,尤其是当您希望使用大型本地对象时。指定它们中的任何一个,并为 NNN
指定一个合理的数字(比如 4000000),我在你的 main
函数上收到警告。
在下面的 C++ 代码中,在执行 main()
的第一行之前发生段错误。
即使在输入 main()
之前没有要构造的对象,也会发生这种情况,如果我在 [=14] 的第二行删除一个(大)变量定义,它确实 而不是 发生=].
我假设发生分段错误是因为定义的变量的大小。我的问题是为什么会在 before the prior line is executed?
由于优化器对指令重新排序,这似乎不应该发生。我是根据选择的编译选项和调试输出说的。
正在定义的(数组)变量的大小是否会破坏堆栈/导致段错误?
看起来是这样,因为使用较小的数组(例如 15 个元素)不会导致分段错误,并且可以看到标准输出的预期输出。
#include <array>
#include <iostream>
#include <vector>
using namespace std;
namespace {
using indexes_t = vector<unsigned int>;
using my_uint_t = unsigned long long int;
constexpr my_uint_t ITEMS{ 52 };
constexpr my_uint_t CHOICES{ 5 };
static_assert(CHOICES <= ITEMS, "CHOICES must be <= ITEMS");
constexpr my_uint_t combinations(const my_uint_t n, my_uint_t r)
{
if (r > n - r)
r = n - r;
my_uint_t rval{ 1 };
for (my_uint_t i{ 1 }; i <= r; ++i) {
rval *= n - r + i;
rval /= i;
}
return rval;
}
using hand_map_t = array<indexes_t, combinations(ITEMS, CHOICES)>;
class dynamic_loop_functor_t {
private:
// std::array of C(52,5) = 2,598,960 (initially) empty vector<unsigned int>
hand_map_t hand_map;
};
}
int main()
{
cout << "Starting main()..." << endl
<< std::flush;
// "Starting main()..." is not printed if and only if the line below is included.
dynamic_loop_functor_t dlf;
// The same result occurs with either of these alternatives:
// array<indexes_t, 2598960> hand_map;
// indexes_t hand_map[2598960];
}
- OS: CentOS Linux 发布 7.9.2009(核心)
- 编译器:g++ (GCC) 7.3.1 20180303 (Red Hat 7.3.1-5)
- 编译命令:
g++ -std=c++14 -Wall -Wpedantic -Og -g -o create_hand_map create_hand_map.cpp
编译时不会生成错误或警告。
静态分析:
通过 cppcheck 进行的静态分析不会产生意外结果。
按照下面命令输出中的建议使用 check-config 只会产生:Please note: Cppcheck does not need standard library headers to get proper results.
$ cppcheck --enable=all create_hand_map.cpp
create_hand_map.cpp:136:27: style: Unused variable: dlf [unusedVariable]
dynamic_loop_functor_t dlf;
^
nofile:0:0: information: Cppcheck cannot find all the include files (use --check-config for details) [missingIncludeSystem]
尝试使用 GDB 进行调试:
$ gdb ./create_hand_map
GNU gdb (GDB) Red Hat Enterprise Linux 8.0.1-36.el7
<snip>
This GDB was configured as "x86_64-redhat-linux-gnu".
<snip>
Reading symbols from ./create_hand_map...done.
(gdb) run
Starting program: ./create_hand_map
Program received signal SIGSEGV, Segmentation fault.
0x0000000000400894 in std::operator<< <std::char_traits<char> > (__s=0x4009c0 "Starting main()...",
__out=...) at /opt/rh/devtoolset-7/root/usr/include/c++/7/ostream:561
561 __ostream_insert(__out, __s,
(gdb) bt
#0 0x0000000000400894 in std::operator<< <std::char_traits<char> > (
__s=0x4009c0 "Starting main()...", __out=...)
at /opt/rh/devtoolset-7/root/usr/include/c++/7/ostream:561
#1 main () at create_hand_map.cpp:133
(gdb)
这绝对是堆栈溢出。 sizeof(dynamic_loop_functor_t)
接近 64 MiB,大多数 Linux 发行版的默认堆栈大小限制仅为 8 MiB。所以崩溃并不奇怪。
剩下的问题是,为什么调试器将崩溃识别为来自内部 std::operator<<
?实际的段错误是由第一条访问超出堆栈限制的地址的指令引发的 CPU 异常引起的。调试器仅获取错误指令的地址,并且必须使用编译器提供的调试信息将其与特定的源代码行相关联。
这个过程的结果并不总是直观的。指令和源代码行之间并不总是有明确的对应关系,尤其是当优化器可能对指令重新排序或组合来自不同行的代码时。此外,在许多情况下,一个源代码行的错误或问题可能会导致另一段无辜的代码出现错误。因此,调试器显示的源代码行应始终持保留态度。
在这种情况下,发生的事情如下。
编译器决定所有局部变量需要的栈总量space,并在函数最开始的栈指针中减去这个数进行分配,在 prologue。这比在声明时为每个局部变量单独分配更有效。 (请注意,构造函数(如果有的话)直到代码中变量声明实际出现的位置才会被调用。)
序言代码通常不与任何特定的源代码行关联,或者可能与包含函数开头的行关联
{
。但无论如何,从栈指针中减去是一个纯粹的寄存器操作;它不访问内存,因此不会自行导致段错误。尽管如此,堆栈指针现在指向为堆栈映射的区域之外,因此下一次尝试访问堆栈指针附近的内存将出现段错误。main
的下几条指令执行cout << "Starting main"
。这在概念上是对标准库中重载的operator<<
的调用;但在 GCC 的 libstdc++ 中,operator<<
是一个非常短的函数,它只调用名为__ostream_insert
的内部辅助函数。由于它太短了,编译器决定将operator<<
内联到main
中,因此main
实际上包含对__ostream_insert
的调用。这是出错的指令:x86call
指令将 return 地址压入堆栈,并且堆栈指针,如前所述,超出范围。现在设置参数和调用
__ostream_insert
的指令在<ostream>
头文件中被调试信息标记为对应于operator<<
的源代码——即使那些说明已内联到main
。因此,您的调试器显示崩溃发生在“内部”operator<<
.如果编译器没有内联
operator<<
(例如,如果您在没有优化的情况下编译),那么main
将包含对operator<<
的实际调用,而这个调用就是坠毁。在那种情况下,回溯将指向main
本身中的cout << "Starting main"
行 - 以不同的方式误导。
请注意,您可以使用 -Wstack-usage=NNN
或 -Wframe-larger-than=NNN
选项让 GCC 警告您有关使用大量堆栈的函数。 -Wall
未启用这些,但添加到您的构建中可能很有用,尤其是当您希望使用大型本地对象时。指定它们中的任何一个,并为 NNN
指定一个合理的数字(比如 4000000),我在你的 main
函数上收到警告。