标准行向量矩阵运算
Standart rowwise vector matrix operations
我正在搜索按行向量矩阵运算(我认为这应该是 BLAS 2 级例程)。例如,从矩阵中逐行减去一个向量,或通过它的行总和对矩阵进行归一化。有没有这样优化的标准套路?
很遗憾,BLAS中没有这样的操作。此处列出了所有可用的子例程:http://www.netlib.org/lapack/lug/node145.html
您可以编写自己的子程序并为 norm、axpy 等作业调用 BLAS 级别 1...但是,性能的提高通常不大。
-> BLAS 对于矩阵-矩阵(或矩阵-向量)产品非常重要,其中缓存管理、数据位置和访问模式(在性能方面)有很大的不同。
我正在搜索按行向量矩阵运算(我认为这应该是 BLAS 2 级例程)。例如,从矩阵中逐行减去一个向量,或通过它的行总和对矩阵进行归一化。有没有这样优化的标准套路?
很遗憾,BLAS中没有这样的操作。此处列出了所有可用的子例程:http://www.netlib.org/lapack/lug/node145.html
您可以编写自己的子程序并为 norm、axpy 等作业调用 BLAS 级别 1...但是,性能的提高通常不大。
-> BLAS 对于矩阵-矩阵(或矩阵-向量)产品非常重要,其中缓存管理、数据位置和访问模式(在性能方面)有很大的不同。