堆上已分配内存的总线错误
Bus error with allocated memory on a heap
我在这样的代码中有总线错误:
char* mem_original;
int int_var = 987411;
mem_original = new char [250];
memcpy(&mem_original[250-sizeof(int)], &int_var, sizeof(int));
...
const unsigned char* mem_u_const = (unsigned char*)mem_original;
...
const unsigned char *location = mem_u_const + 250 - sizeof(int);
std::cout << "sizeof(int) = " << sizeof(int) << std::endl;//it's printed out as 4
std::cout << "byte 0 = " << int(*location) << std::endl;
std::cout << "byte 1 = " << int(*(location+1)) << std::endl;
std::cout << "byte 2 = " << int(*(location+2)) << std::endl;
std::cout << "byte 3 = " << int(*(location+3)) << std::endl;
int original_var = *((const int*)location);
std::cout << "original_var = " << original_var << std::endl;
几次都很好用,打印出来:
sizeof(int) = 4
byte 0 = 0
byte 1 = 15
byte 2 = 17
byte 3 = 19
original_var = 987411
然后它失败了:
sizeof(int) = 4
byte 0 = 0
byte 1 = 15
byte 2 = 17
byte 3 = 19
Bus Error
它是在 Solaris OS (C++ 5.12) 上构建的 & 运行
Linux (gcc 4.12) & Windows (msvc-9.0) 上的相同代码运行良好。
我们可以看到:
- 内存由 new[] 在堆上分配。
- 内存可访问(我们可以逐字节读取)
- 内存包含正确的内容,没有损坏。
那么总线错误的可能原因是什么?我应该看哪里?
更新:
如果我 memcpy(...) location
最后到 original_var
,它就可以工作。但是 *((const int*)location)
中的问题是什么?
我在编译您的代码时收到以下警告:
main.cpp:19:26: warning: cast from 'const unsigned char *' to 'const int *' increases required alignment from 1 to 4 [-Wcast-align]
int original_var = *((const int*)location);
^~~~~~~~~~~~~~~~~~~~
这似乎是总线错误的原因,因为improperly aligned access can cause a bus error.
虽然我现在无法访问 SPARC 来对此进行测试,但根据我在该平台上的经验,我非常确定这一行是您的问题:
const unsigned char *location = mem_u_const + 250 - sizeof(int);
mem_u_const
块最初由 new
分配给一个字符数组。因为 sizeof(unsigned char)
是 1 而 sizeof(int)
是 4,所以您要添加 246 个字节。这不是 4 的倍数。
在 SPARC 上,CPU 只能读取与 4 字节边界对齐的 4 字节字。您尝试读取未对齐的字是导致总线错误的原因。
我建议分配一个 struct
和一个 unsigned char
后跟一个 int
的数组,而不是像导致此错误的那样分配一堆指针数学和强制转换。
对于没有使用具有对齐限制的硬件(例如 SPARC)经验的开发人员来说,这是一个常见问题。 x86 硬件非常 容忍错位访问,尽管会影响性能。其他类型的硬件? SIGBUS
.
这行代码:
int original_var = *((const int*)location);
调用未定义的行为。您正在使用 unsigned char *
并将其指向的内容解释为 int
。你不能安全地这样做。时期。这是未定义的行为 - 这正是您遇到的原因。
您违反了严格的别名规则。请参阅 What is the strict aliasing rule? 简而言之,您不能将一种类型的对象称为另一种类型。 char *
不会也不能引用 int
.
Oracle 的 Solaris Studio 编译器实际上提供了一个命令行参数,可以让您在 SPARC 硬件上摆脱它 - -xmemalign=1i
(请参阅 https://docs.oracle.com/cd/E19205-01/819-5265/bjavc/index.html)。尽管对 GCC 公平,但如果没有该选项,您在代码中执行的强制操作在 Studio 编译器下仍将 SIGBUS
。
或者,正如您已经指出的那样,您可以使用 memcpy()
来复制字节,无论它们是什么 - 只要您知道源对象可以安全地复制到目标对象中 - 是的,有些情况下 不是 true。
我在这样的代码中有总线错误:
char* mem_original;
int int_var = 987411;
mem_original = new char [250];
memcpy(&mem_original[250-sizeof(int)], &int_var, sizeof(int));
...
const unsigned char* mem_u_const = (unsigned char*)mem_original;
...
const unsigned char *location = mem_u_const + 250 - sizeof(int);
std::cout << "sizeof(int) = " << sizeof(int) << std::endl;//it's printed out as 4
std::cout << "byte 0 = " << int(*location) << std::endl;
std::cout << "byte 1 = " << int(*(location+1)) << std::endl;
std::cout << "byte 2 = " << int(*(location+2)) << std::endl;
std::cout << "byte 3 = " << int(*(location+3)) << std::endl;
int original_var = *((const int*)location);
std::cout << "original_var = " << original_var << std::endl;
几次都很好用,打印出来:
sizeof(int) = 4
byte 0 = 0
byte 1 = 15
byte 2 = 17
byte 3 = 19
original_var = 987411
然后它失败了:
sizeof(int) = 4
byte 0 = 0
byte 1 = 15
byte 2 = 17
byte 3 = 19
Bus Error
它是在 Solaris OS (C++ 5.12) 上构建的 & 运行 Linux (gcc 4.12) & Windows (msvc-9.0) 上的相同代码运行良好。
我们可以看到:
- 内存由 new[] 在堆上分配。
- 内存可访问(我们可以逐字节读取)
- 内存包含正确的内容,没有损坏。
那么总线错误的可能原因是什么?我应该看哪里?
更新:
如果我 memcpy(...) location
最后到 original_var
,它就可以工作。但是 *((const int*)location)
中的问题是什么?
我在编译您的代码时收到以下警告:
main.cpp:19:26: warning: cast from 'const unsigned char *' to 'const int *' increases required alignment from 1 to 4 [-Wcast-align]
int original_var = *((const int*)location);
^~~~~~~~~~~~~~~~~~~~
这似乎是总线错误的原因,因为improperly aligned access can cause a bus error.
虽然我现在无法访问 SPARC 来对此进行测试,但根据我在该平台上的经验,我非常确定这一行是您的问题:
const unsigned char *location = mem_u_const + 250 - sizeof(int);
mem_u_const
块最初由 new
分配给一个字符数组。因为 sizeof(unsigned char)
是 1 而 sizeof(int)
是 4,所以您要添加 246 个字节。这不是 4 的倍数。
在 SPARC 上,CPU 只能读取与 4 字节边界对齐的 4 字节字。您尝试读取未对齐的字是导致总线错误的原因。
我建议分配一个 struct
和一个 unsigned char
后跟一个 int
的数组,而不是像导致此错误的那样分配一堆指针数学和强制转换。
对于没有使用具有对齐限制的硬件(例如 SPARC)经验的开发人员来说,这是一个常见问题。 x86 硬件非常 容忍错位访问,尽管会影响性能。其他类型的硬件? SIGBUS
.
这行代码:
int original_var = *((const int*)location);
调用未定义的行为。您正在使用 unsigned char *
并将其指向的内容解释为 int
。你不能安全地这样做。时期。这是未定义的行为 - 这正是您遇到的原因。
您违反了严格的别名规则。请参阅 What is the strict aliasing rule? 简而言之,您不能将一种类型的对象称为另一种类型。 char *
不会也不能引用 int
.
Oracle 的 Solaris Studio 编译器实际上提供了一个命令行参数,可以让您在 SPARC 硬件上摆脱它 - -xmemalign=1i
(请参阅 https://docs.oracle.com/cd/E19205-01/819-5265/bjavc/index.html)。尽管对 GCC 公平,但如果没有该选项,您在代码中执行的强制操作在 Studio 编译器下仍将 SIGBUS
。
或者,正如您已经指出的那样,您可以使用 memcpy()
来复制字节,无论它们是什么 - 只要您知道源对象可以安全地复制到目标对象中 - 是的,有些情况下 不是 true。