如何显示完整的 scikit 稀疏矩阵

How to show the full scikit's sparse matrix

我正在用 tfidf 向量化:

X = tfidf_vect.fit_transform(df['string'].values)

我想获取上面代码的整个矩阵,所以我尝试了这个:

print X.toarray()

并获得了这个:

[[0 0 0 ..., 0 0 0]
 [0 0 0 ..., 0 0 0]
 [0 0 0 ..., 0 0 0]
 ..., 
 [0 0 0 ..., 0 0 0]
 [0 0 0 ..., 0 0 0]
 [0 0 0 ..., 0 0 0]]

如何写入一些 txt 文件或查看完整矩阵 X?

以下是将其写入文本文件的方法:

pd.DataFrame(X.toarray()).to_csv('bow.csv')

请记住,它可能具有非常高的 'n',并且可能会产生非常大的 .txt

为了交互使用,您可以更改要显示的项目数

numpy.set_printoptions(edgeitems=1e9)

要保存到文本文件,请使用 numpy.savetxt(X.toarray()) 或其他类似功能。