Doc2vec 表示中缺少句子

Missing sentences from the Doc2vec representation

我正在使用 gensim 框架中的 Doc2vec class 来计算语料库中每个文档的矢量表示。

语料库包含非常短的句子,甚至可以有一个词。我观察到对于许多句子,尤其是短句,Doc2vec 不提供任何表示。有人可以解释一下原因吗?

我遇到了同样的问题。我通过设置参数 min_count=1.

解决了
model = doc2vec.Doc2Vec(size=100)

变成了

model = doc2vec.Doc2Vec(size=100, min_count=1)

解决了我的问题!

我在 doc2vec 教程的评论中找到了答案 http://radimrehurek.com/2014/12/doc2vec-tutorial/