获取文档向量值的正确方法是什么?
What is correct way to get doc vectors values?
如何获取特定的文档向量值?通过标签,像这样:
modelValues = model.docvecs['myDocTag']
或者只能通过索引,像这样:
modelValues = model.docvecs[12]
(在最后一种情况下,我必须知道匹配tag
→index
...)
您可以使用其中任何一种,但应该使用与培训期间提供的相同类型的 tag
键。
因此,如果您在训练期间标记的文档的字符串标记为 'myDocTag'
,您应该使用 model.docvecs['myDocTag']
。
如果您明确提供纯 int 标签,则可以使用 model.docvecs[12]
。 (但请注意,在这种情况下,您应该小心分配从 0 开始的连续整数。)
如何获取特定的文档向量值?通过标签,像这样:
modelValues = model.docvecs['myDocTag']
或者只能通过索引,像这样:
modelValues = model.docvecs[12]
(在最后一种情况下,我必须知道匹配tag
→index
...)
您可以使用其中任何一种,但应该使用与培训期间提供的相同类型的 tag
键。
因此,如果您在训练期间标记的文档的字符串标记为 'myDocTag'
,您应该使用 model.docvecs['myDocTag']
。
如果您明确提供纯 int 标签,则可以使用 model.docvecs[12]
。 (但请注意,在这种情况下,您应该小心分配从 0 开始的连续整数。)