Doc2vec 表示中缺少句子
Missing sentences from the Doc2vec representation
我正在使用 gensim 框架中的 Doc2vec class 来计算语料库中每个文档的矢量表示。
语料库包含非常短的句子,甚至可以有一个词。我观察到对于许多句子,尤其是短句,Doc2vec 不提供任何表示。有人可以解释一下原因吗?
我遇到了同样的问题。我通过设置参数 min_count=1.
解决了
model = doc2vec.Doc2Vec(size=100)
变成了
model = doc2vec.Doc2Vec(size=100, min_count=1)
解决了我的问题!
我在 doc2vec 教程的评论中找到了答案 http://radimrehurek.com/2014/12/doc2vec-tutorial/
我正在使用 gensim 框架中的 Doc2vec class 来计算语料库中每个文档的矢量表示。
语料库包含非常短的句子,甚至可以有一个词。我观察到对于许多句子,尤其是短句,Doc2vec 不提供任何表示。有人可以解释一下原因吗?
我遇到了同样的问题。我通过设置参数 min_count=1.
解决了model = doc2vec.Doc2Vec(size=100)
变成了
model = doc2vec.Doc2Vec(size=100, min_count=1)
解决了我的问题!
我在 doc2vec 教程的评论中找到了答案 http://radimrehurek.com/2014/12/doc2vec-tutorial/