cBLAS 矩阵乘法调用不适用于 1XN 和 NxN 矩阵
cBLAS matrix multiply call not working for 1XN and NxN matrices
我正在尝试使用 cblas_dgemm 对 1 x N 和 N x N 矩阵执行矩阵乘法。我的调用如下:
cblas_dgemm(CblasRowMajor, CblasNoTrans, CblasNoTrans,
1, width, width, 1.0, A, width, B, width,
0.0, C, width);
但是我在 C 中得到的只是 A 的副本。
这是该方法的文档:https://software.intel.com/en-us/node/429920
我已经多次检查这些参数,它们看起来都很好,所以我想知道是否有人可以指出我在做什么愚蠢的事情?
我只需要转置矩阵 B 或设置 CblasColMajor,因为我的矩阵 B 已经存储在 col 主要顺序中。
我正在尝试使用 cblas_dgemm 对 1 x N 和 N x N 矩阵执行矩阵乘法。我的调用如下:
cblas_dgemm(CblasRowMajor, CblasNoTrans, CblasNoTrans,
1, width, width, 1.0, A, width, B, width,
0.0, C, width);
但是我在 C 中得到的只是 A 的副本。
这是该方法的文档:https://software.intel.com/en-us/node/429920
我已经多次检查这些参数,它们看起来都很好,所以我想知道是否有人可以指出我在做什么愚蠢的事情?
我只需要转置矩阵 B 或设置 CblasColMajor,因为我的矩阵 B 已经存储在 col 主要顺序中。