can/cannot 用于压缩稀疏行 (CSR) 矩阵的 numpy 函数

numpy functions that can/cannot be used on a compressed sparse row (CSR) matrix

我是 Python 的新手,我有一个(可能非常幼稚的)问题。我有一个 CSR(压缩稀疏行)矩阵可以处理(我们将其命名为 M),并且看起来有些函数是为我的矩阵工作的 2d numpy 数组操作而设计的,而其他一些则没有。

例如,numpy.sum(M, axis=0) 工作正常,而 numpy.diagonal(M) 给出错误提示 {ValueError}diag requires an array of at least two dimensions

那么,为什么一个矩阵函数适用于 M 而另一个不适用,这背后是否存在基本原理?

还有一个额外的问题是,如果上述 numpy.diagonal 不适用,如何从 CSR 矩阵中获取对角线元素?

np.diagonal 的代码是:

return asanyarray(a).diagonal(offset=offset, axis1=axis1, axis2=axis2)

也就是说,它首先尝试将参数转换为数组,例如,如果它是列表的列表。但这不是将稀疏矩阵转换为 ndarray.

的正确方法
In [33]: from scipy import sparse                                               
In [34]: M = sparse.csr_matrix(np.eye(3))                                       
In [35]: M                                                                      
Out[35]: 
<3x3 sparse matrix of type '<class 'numpy.float64'>'
    with 3 stored elements in Compressed Sparse Row format>
In [36]: M.A                                  # right                                  
Out[36]: 
array([[1., 0., 0.],
       [0., 1., 0.],
       [0., 0., 1.]])
In [37]: np.asanyarray(M)                    # wrong                           
Out[37]: 
array(<3x3 sparse matrix of type '<class 'numpy.float64'>'
    with 3 stored elements in Compressed Sparse Row format>, dtype=object)

np.diagonal的正确使用方法是:

In [38]: np.diagonal(M.A)                                                       
Out[38]: array([1., 1., 1.])

但没必要。 M 已经有一个 diagonal 方法:

In [39]: M.diagonal()                                                           
Out[39]: array([1., 1., 1.])

np.sum 确实有效,因为它将操作委托给方法(查看其代码):

In [40]: M.sum(axis=0)                                                          
Out[40]: matrix([[1., 1., 1.]])
In [41]: np.sum(M, axis=0)                                                      
Out[41]: matrix([[1., 1., 1.]])

作为一般规则,尝试在稀疏矩阵上使用 sparse 函数和方法。不要指望 numpy 功能正常工作。 sparse 建立在 numpy 之上,但 numpy 不 'know' 关于 sparse