如何处理 SIGSEGV,分段错误。在使用 Avx2 时
How to deal with SIGSEGV, Segmentation fault. while using Avx2
如何处理 SIGSEGV,分段错误。使用 Avx2 (_mm256_load_pd)(_mm256_store_pd)
(已解决)
_mm256_load_pd
我在调用时收到分段错误
_mm256_load_pd
用法如上图
double * Val = malloc(sizeof(double)*4);
__m256d vecv = _mm256_load_pd(&Val[0]);
gdb 显示
Program received signal SIGSEGV, Segmentation fault.
0x00007ffff7fc5017 in _mm256_load_pd (__P=0x555555559370)
at /usr/lib/gcc/x86_64-linux-gnu/9/include/avxintrin.h:862
862 return *(__m256d *)__P;
(gdb) frame 1
#1 gemv_d_lineProduct_4_avx2 (Val=0x555555559370, indx=0x5555555592f0,
Vector_X=0x5555555592c0, Vector_Y=0x555555559340)
at someThing.c:114
114 __m256d vecv = _mm256_load_pd(&Val[0]);
(gdb)
_mm256_store_pd
当我把 Val 变大时
double * Val = malloc(sizeof(double)*4);
我发现 _mm256_load_pd 工作正常但结果是
Program received signal SIGSEGV, Segmentation fault.
0x00007ffff7fc50e3 in _mm256_store_pd (__A=..., __P=0x555555559390)
at /usr/lib/gcc/x86_64-linux-gnu/9/include/avxintrin.h:868
868 *(__m256d *)__P = __A;
(gdb) frame 1
#1 gemv_d_lineProduct_4_avx2 (Val=0x5555555593e0, indx=0x555555559310,
Vector_X=0x5555555592c0, Vector_Y=0x555555559390)
at something.c:122
122 _mm256_store_pd(Vector_Y,vecY);
完整项目
https://github.com/DevilInChina/gemv
mkdir build;cd build
cmake ..
make
cd ../bin
./line
#then might get some seg fault
求解方法
将内存分配函数更改为
void *aligned_alloc (size_t __alignment, size_t __size);
第一个参数应该是 1024 或其他。
感谢igor-r
根据Intel reference,_mm256_load_pd()
需要32字节对齐的指针。
请使用 aligned_alloc()
分配具有正确对齐方式的内存块。
如何处理 SIGSEGV,分段错误。使用 Avx2 (_mm256_load_pd)(_mm256_store_pd)
(已解决)
_mm256_load_pd
我在调用时收到分段错误
_mm256_load_pd
用法如上图
double * Val = malloc(sizeof(double)*4);
__m256d vecv = _mm256_load_pd(&Val[0]);
gdb 显示
Program received signal SIGSEGV, Segmentation fault.
0x00007ffff7fc5017 in _mm256_load_pd (__P=0x555555559370)
at /usr/lib/gcc/x86_64-linux-gnu/9/include/avxintrin.h:862
862 return *(__m256d *)__P;
(gdb) frame 1
#1 gemv_d_lineProduct_4_avx2 (Val=0x555555559370, indx=0x5555555592f0,
Vector_X=0x5555555592c0, Vector_Y=0x555555559340)
at someThing.c:114
114 __m256d vecv = _mm256_load_pd(&Val[0]);
(gdb)
_mm256_store_pd
当我把 Val 变大时
double * Val = malloc(sizeof(double)*4);
我发现 _mm256_load_pd 工作正常但结果是
Program received signal SIGSEGV, Segmentation fault.
0x00007ffff7fc50e3 in _mm256_store_pd (__A=..., __P=0x555555559390)
at /usr/lib/gcc/x86_64-linux-gnu/9/include/avxintrin.h:868
868 *(__m256d *)__P = __A;
(gdb) frame 1
#1 gemv_d_lineProduct_4_avx2 (Val=0x5555555593e0, indx=0x555555559310,
Vector_X=0x5555555592c0, Vector_Y=0x555555559390)
at something.c:122
122 _mm256_store_pd(Vector_Y,vecY);
完整项目
https://github.com/DevilInChina/gemv
mkdir build;cd build
cmake ..
make
cd ../bin
./line
#then might get some seg fault
求解方法
将内存分配函数更改为
void *aligned_alloc (size_t __alignment, size_t __size);
第一个参数应该是 1024 或其他。
感谢igor-r
根据Intel reference,_mm256_load_pd()
需要32字节对齐的指针。
请使用 aligned_alloc()
分配具有正确对齐方式的内存块。