与 Doc2Vec 的相似性
Similarity with Doc2Vec
我正在学习 Doc2Vec 的 Gensim 教程:https://medium.com/@mishra.thedeepak/doc2vec-simple-implementation-example-df2afbbfbad5
现在,到达终点后,我想计算训练数据中文档的相似度分数。这些文档向量由 model.docvecs[0]
、model.docvecs[1]
等
给出
但是当我尝试 运行 例如
cossim(model.docvecs[0], model.docvecs[1])
我收到 TypeError cannot convert dictionary update sequence element #0 to a sequence
。如何计算训练数据中文档之间的余弦相似度?
很好地解释了该错误的含义。
很好地解释了您的情况。
因此,如 keyed vectors 的文档所述,您应该使用 model.docvecs.distance(0, 1)
来计算两个文档之间的余弦距离。
我正在学习 Doc2Vec 的 Gensim 教程:https://medium.com/@mishra.thedeepak/doc2vec-simple-implementation-example-df2afbbfbad5
现在,到达终点后,我想计算训练数据中文档的相似度分数。这些文档向量由 model.docvecs[0]
、model.docvecs[1]
等
但是当我尝试 运行 例如
cossim(model.docvecs[0], model.docvecs[1])
我收到 TypeError cannot convert dictionary update sequence element #0 to a sequence
。如何计算训练数据中文档之间的余弦相似度?
因此,如 keyed vectors 的文档所述,您应该使用 model.docvecs.distance(0, 1)
来计算两个文档之间的余弦距离。