获取文档向量值的正确方法是什么?

What is correct way to get doc vectors values?

如何获取特定的文档向量值?通过标签,像这样:

modelValues = model.docvecs['myDocTag']

或者只能通过索引,像这样:

modelValues = model.docvecs[12]

(在最后一种情况下,我必须知道匹配tagindex...)

您可以使用其中任何一种,但应该使用与培训期间提供的相同类型的 tag 键。

因此,如果您在训练期间标记的文档的字符串标记为 'myDocTag',您应该使用 model.docvecs['myDocTag']

如果您明确提供纯 int 标签,则可以使用 model.docvecs[12]。 (但请注意,在这种情况下,您应该小心分配从 0 开始的连续整数。)