corpus2dense 需要两个参数,但教程示例只使用一个

corpus2dense requires two arguments, but tutorial example only uses one

我在 github (https://github.com/piskvorky/gensim/issues/274)

上发布了这个问题

但是,我需要有关如何实际使用 gensim 与 numpy 的兼容性的帮助。

我尝试传递无,len(corpus),0-2 都失败了。

以下为语料库:

[(0, 1.0), (1, 1.0), (2, 1.0)]
[(0, 1.0), (3, 1.0), (4, 1.0), (5, 1.0), (6, 1.0), (7, 1.0)]
[(2, 1.0), (5, 1.0), (7, 1.0), (8, 1.0)]
[(1, 1.0), (5, 2.0), (8, 1.0)]
[(3, 1.0), (6, 1.0), (7, 1.0)]
[(9, 1.0)]
[(9, 1.0), (10, 1.0)]
[(9, 1.0), (10, 1.0), (11, 1.0)]
[(4, 1.0), (10, 1.0), (11, 1.0)]

这是在我的 iPython 笔记本中不起作用的代码:

from gensim import matutils
corpus = corpora.MmCorpus('/tmp/corpus.mm')
import numpy
numpy_matrix = matutils.corpus2dense(corpus)

抛出 IndexErrors

如我的评论所述,它应该是 2*len(corpus) 而不是 len(corpus)