如何显示完整的 scikit 稀疏矩阵

Question

我正在用 tfidf 向量化：

X = tfidf_vect.fit_transform(df['string'].values)

我想获取上面代码的整个矩阵，所以我尝试了这个：

print X.toarray()

并获得了这个：

[[0 0 0 ..., 0 0 0]
 [0 0 0 ..., 0 0 0]
 [0 0 0 ..., 0 0 0]
 ..., 
 [0 0 0 ..., 0 0 0]
 [0 0 0 ..., 0 0 0]
 [0 0 0 ..., 0 0 0]]

如何写入一些 txt 文件或查看完整矩阵 X？

Answer 1

以下是将其写入文本文件的方法：

pd.DataFrame(X.toarray()).to_csv('bow.csv')

请记住，它可能具有非常高的 'n'，并且可能会产生非常大的 .txt

Answer 2

为了交互使用，您可以更改要显示的项目数

numpy.set_printoptions(edgeitems=1e9)

要保存到文本文件，请使用 numpy.savetxt(X.toarray()) 或其他类似功能。

How to show the full scikit's sparse matrix