如何消除(Python)中稀疏矩阵中的零点?
How to eliminate zeros in sparse matrix in (Python)?
我需要一个稀疏矩阵(我正在使用 scipy.sparse
中的 Compressed Sparse Row Format (CSR))来进行一些计算。我以 (data, (row, col))
元组的形式拥有它。不幸的是,一些行和列将全部为零,我想摆脱这些零。现在我有:
[In]:
from scipy.sparse import csr_matrix
aa = csr_matrix((1,2,3), ((0,2,2), (0,1,2))
aa.todense()
[Out]:
matrix([[1, 0, 0],
[0, 0, 0],
[0, 2, 3]], dtype=int64)
我想要:
[Out]:
matrix([[1, 0, 0],
[0, 2, 3]], dtype=int64)
在对象上使用方法 eliminate_zeros()
后,我得到 None
:
[In]:
aa2 = csr_matrix.eliminate_zeros(aa)
type(aa2)
[Out]:
<class 'NoneType'>
为什么那个方法会把它变成None?
有没有其他方法可以获得稀疏矩阵(不必是 CSR)并轻松摆脱空 rows/columns?
我正在使用 Python 3.4.0.
在 CSR 格式中,去除全零行相对容易:
>>> import scipy.sparse as sps
>>> a = sps.csr_matrix([[1, 0, 0], [0, 0, 0], [0, 2, 3]])
>>> a.indptr
array([0, 1, 1, 3])
>>> mask = np.concatenate(([True], a.indptr[1:] != a.indptr[:-1]))
>>> mask # 1st occurrence of unique a.indptr entries
array([ True, True, False, True], dtype=bool)
>>> sps.csr_matrix((a.data, a.indices, a.indptr[mask])).A
array([[1, 0, 0],
[0, 2, 3]])
然后您可以将稀疏数组转换为 CSC 格式,然后完全相同的技巧将删除所有零列。
我不确定它的性能如何,但语法更易读:
>>> a[a.getnnz(axis=1) != 0][:, a.getnnz(axis=0) != 0].A
array([[1, 0, 0],
[0, 2, 3]])
也有效。
我需要一个稀疏矩阵(我正在使用 scipy.sparse
中的 Compressed Sparse Row Format (CSR))来进行一些计算。我以 (data, (row, col))
元组的形式拥有它。不幸的是,一些行和列将全部为零,我想摆脱这些零。现在我有:
[In]:
from scipy.sparse import csr_matrix
aa = csr_matrix((1,2,3), ((0,2,2), (0,1,2))
aa.todense()
[Out]:
matrix([[1, 0, 0],
[0, 0, 0],
[0, 2, 3]], dtype=int64)
我想要:
[Out]:
matrix([[1, 0, 0],
[0, 2, 3]], dtype=int64)
在对象上使用方法 eliminate_zeros()
后,我得到 None
:
[In]:
aa2 = csr_matrix.eliminate_zeros(aa)
type(aa2)
[Out]:
<class 'NoneType'>
为什么那个方法会把它变成None?
有没有其他方法可以获得稀疏矩阵(不必是 CSR)并轻松摆脱空 rows/columns?
我正在使用 Python 3.4.0.
在 CSR 格式中,去除全零行相对容易:
>>> import scipy.sparse as sps
>>> a = sps.csr_matrix([[1, 0, 0], [0, 0, 0], [0, 2, 3]])
>>> a.indptr
array([0, 1, 1, 3])
>>> mask = np.concatenate(([True], a.indptr[1:] != a.indptr[:-1]))
>>> mask # 1st occurrence of unique a.indptr entries
array([ True, True, False, True], dtype=bool)
>>> sps.csr_matrix((a.data, a.indices, a.indptr[mask])).A
array([[1, 0, 0],
[0, 2, 3]])
然后您可以将稀疏数组转换为 CSC 格式,然后完全相同的技巧将删除所有零列。
我不确定它的性能如何,但语法更易读:
>>> a[a.getnnz(axis=1) != 0][:, a.getnnz(axis=0) != 0].A
array([[1, 0, 0],
[0, 2, 3]])
也有效。