使用 cuSolver 计算一般矩阵的逆的最有效方法是什么?

What is the most efficient way to compute the inverse of a general matrix using cuSolver?

我想使用 cuSolver 包中的 getrfgetrs 并用 B=I.

求解 AB=X

请注意,不幸的是,cuSolver 不提供 getri。因此我必须使用 getrs.

直到CUDA提供了LAPACK API getri,我认为getrfgetrs是大矩阵求逆的最佳选择

矩阵 BA 的大小相同,所以我认为分配 B 不会使该任务消耗比其 input/output 大得多的内存数据确实如此。

getrfgetrs的复杂度分别是O(n^3)O(n^2),而设置B=IO(n^2) + O(n)。我认为这不应该成为整个程序的瓶颈。您可以分享您的实现,以便我们检查问题出在哪里。