BLAS Level 2 band matrix-vector product 多个向量
BLAS Level 2 band matrix-vector product multiple vectors
BLAS Level 2 中存在用于带状矩阵向量乘积的例程,适用于一般情况和对称情况(MKL 实现的链接)。
有没有办法使用多个向量(不使用外部 for 循环)来最大限度地提高这种情况下的性能?
据我所知,答案是否定的。
可在此处找到 3 级 BLAS 子例程的完整列表
http://www.netlib.org/blas/#_level_3
并且没有带状矩阵子程序。
额外信息: 如果您正在使用 blas/lapack & C++,最近有一项设计 C++ 接口的倡议:
http://www.netlib.org/na-digest-html/17/v17n21.html#1
(cblas 和 lapacke 更面向 C 用法)
我认为Spike library应该有这样一个对称情况的套路。不过恐怕帮不上什么忙了,因为我从来没有用过。
Spike(用于系统求解)的算法和实现在[Polizzi & Sameh, Comp. Fluids (36), 2007]中概述。
BLAS Level 2 中存在用于带状矩阵向量乘积的例程,适用于一般情况和对称情况(MKL 实现的链接)。
有没有办法使用多个向量(不使用外部 for 循环)来最大限度地提高这种情况下的性能?
据我所知,答案是否定的。
可在此处找到 3 级 BLAS 子例程的完整列表
http://www.netlib.org/blas/#_level_3
并且没有带状矩阵子程序。
额外信息: 如果您正在使用 blas/lapack & C++,最近有一项设计 C++ 接口的倡议:
http://www.netlib.org/na-digest-html/17/v17n21.html#1
(cblas 和 lapacke 更面向 C 用法)
我认为Spike library应该有这样一个对称情况的套路。不过恐怕帮不上什么忙了,因为我从来没有用过。
Spike(用于系统求解)的算法和实现在[Polizzi & Sameh, Comp. Fluids (36), 2007]中概述。