如何显示完整的 scikit 稀疏矩阵
How to show the full scikit's sparse matrix
我正在用 tfidf 向量化:
X = tfidf_vect.fit_transform(df['string'].values)
我想获取上面代码的整个矩阵,所以我尝试了这个:
print X.toarray()
并获得了这个:
[[0 0 0 ..., 0 0 0]
[0 0 0 ..., 0 0 0]
[0 0 0 ..., 0 0 0]
...,
[0 0 0 ..., 0 0 0]
[0 0 0 ..., 0 0 0]
[0 0 0 ..., 0 0 0]]
如何写入一些 txt 文件或查看完整矩阵 X?
以下是将其写入文本文件的方法:
pd.DataFrame(X.toarray()).to_csv('bow.csv')
请记住,它可能具有非常高的 'n',并且可能会产生非常大的 .txt
为了交互使用,您可以更改要显示的项目数
numpy.set_printoptions(edgeitems=1e9)
要保存到文本文件,请使用 numpy.savetxt(X.toarray())
或其他类似功能。
我正在用 tfidf 向量化:
X = tfidf_vect.fit_transform(df['string'].values)
我想获取上面代码的整个矩阵,所以我尝试了这个:
print X.toarray()
并获得了这个:
[[0 0 0 ..., 0 0 0]
[0 0 0 ..., 0 0 0]
[0 0 0 ..., 0 0 0]
...,
[0 0 0 ..., 0 0 0]
[0 0 0 ..., 0 0 0]
[0 0 0 ..., 0 0 0]]
如何写入一些 txt 文件或查看完整矩阵 X?
以下是将其写入文本文件的方法:
pd.DataFrame(X.toarray()).to_csv('bow.csv')
请记住,它可能具有非常高的 'n',并且可能会产生非常大的 .txt
为了交互使用,您可以更改要显示的项目数
numpy.set_printoptions(edgeitems=1e9)
要保存到文本文件,请使用 numpy.savetxt(X.toarray())
或其他类似功能。