cublas AA' 使用 GEMM

cublas AA' using GEMM

我正在尝试计算 AA' 乘法,其中 A 是 MxN 我正在尝试这个:

    double al =1.0f; // al =1
    double bet =0.0f; // bet =1
stat=cublasDgemm(handle,CUBLAS_OP_N,CUBLAS_OP_T,M,M,N,&al,d_A,M,d_Acopy,M,&bet,d_temp,M);

但是它给出了分割错误I found this question but I couldn't follow

你能帮我做 AA'吗,知道我使用双指针手动初始化了矩阵

double ** m = (double**)malloc(rows * sizeof(double*));

我还保存了如下值

int i,j;
//initalize A
for (i=0;i<cols;i++)
    {
     for (j=0;j<rows;j++)
       {
        a[i][j]=A_example[i*rows+j];
        //a[i][j]=my_round(a[i][j]*10000.0)/10000.0;
        }
    }

我只是按照他们在示例中定义矩阵的方式重新定义了我的矩阵。我认为问题在于他们使用的数据布局。我无法将我的 C 矩阵调整为 cuBlas 格式。

总之: 他们定义如下:

double *m=( double *) malloc (rows*cols* sizeof ( double ));

数据初始化: 诠释我; 诠释 j;

for (i=0;i<k;i ++){
    for (j=0;j<n;j ++){
        printf (" %5.0f",a[ IDX2C(i,j,k )]);
        }

其中 IDX2C 是定义为的宏:

# define IDX2C(i,j,ld) (((j)*( ld ))+( i ))

最后我找到了 AA' 如下:

double al =1.0f; // al =1
double bet =0.0f; // bet =1
stat=cublasDgemm(handle,CUBLAS_OP_N,CUBLAS_OP_T,M,M,N,&al,d_A,N,d_A,M,&bet,d_temp,M);

其中 A 是 MxN 矩阵。