cBLAS 矩阵乘法调用不适用于 1XN 和 NxN 矩阵

cBLAS matrix multiply call not working for 1XN and NxN matrices

我正在尝试使用 cblas_dgemm 对 1 x N 和 N x N 矩阵执行矩阵乘法。我的调用如下:

cblas_dgemm(CblasRowMajor, CblasNoTrans, CblasNoTrans,
    1, width, width, 1.0, A, width, B, width,
    0.0, C, width);

但是我在 C 中得到的只是 A 的副本。

这是该方法的文档:https://software.intel.com/en-us/node/429920

我已经多次检查这些参数,它们看起来都很好,所以我想知道是否有人可以指出我在做什么愚蠢的事情?

我只需要转置矩阵 B 或设置 CblasColMajor,因为我的矩阵 B 已经存储在 col 主要顺序中。