如何处理 SIGSEGV,分段错误。在使用 Avx2 时

How to deal with SIGSEGV, Segmentation fault. while using Avx2

如何处理 SIGSEGV,分段错误。使用 Avx2 (_mm256_load_pd)(_mm256_store_pd)

(已解决)

_mm256_load_pd

我在调用时收到分段错误

_mm256_load_pd

用法如上图

double * Val = malloc(sizeof(double)*4);
__m256d vecv = _mm256_load_pd(&Val[0]);

gdb 显示

Program received signal SIGSEGV, Segmentation fault.
0x00007ffff7fc5017 in _mm256_load_pd (__P=0x555555559370)
    at /usr/lib/gcc/x86_64-linux-gnu/9/include/avxintrin.h:862
862   return *(__m256d *)__P;
(gdb) frame 1
#1  gemv_d_lineProduct_4_avx2 (Val=0x555555559370, indx=0x5555555592f0, 
    Vector_X=0x5555555592c0, Vector_Y=0x555555559340)
    at someThing.c:114
114     __m256d vecv = _mm256_load_pd(&Val[0]);
(gdb) 

_mm256_store_pd

当我把 Val 变大时

double * Val = malloc(sizeof(double)*4);

我发现 _mm256_load_pd 工作正常但结果是

Program received signal SIGSEGV, Segmentation fault.
0x00007ffff7fc50e3 in _mm256_store_pd (__A=..., __P=0x555555559390)
    at /usr/lib/gcc/x86_64-linux-gnu/9/include/avxintrin.h:868
868   *(__m256d *)__P = __A;
(gdb) frame 1
#1  gemv_d_lineProduct_4_avx2 (Val=0x5555555593e0, indx=0x555555559310, 
    Vector_X=0x5555555592c0, Vector_Y=0x555555559390)
    at something.c:122
122     _mm256_store_pd(Vector_Y,vecY);

完整项目

https://github.com/DevilInChina/gemv

mkdir build;cd build
cmake ..
make
cd ../bin
./line
#then might get some seg fault

求解方法

将内存分配函数更改为

void *aligned_alloc (size_t __alignment, size_t __size);

第一个参数应该是 1024 或其他。

感谢igor-r

根据Intel reference_mm256_load_pd()需要32字节对齐的指针。

请使用 aligned_alloc() 分配具有正确对齐方式的内存块。