Infer "shapes",或者推断Word2Vec中的类比关系
Infer "shapes", or infer analogous relations in Word2Vec
Gensim Word2Vec 提供了一个系统来推断类似关系,即与已经找到的那些具有“相同形状”的关系?
Es:
从国王、王后
开始
我想得到其他男女性别的情侣。
换句话说:
most_similar(正数=['king', X], 负数=['queen']) -> Y
我想找到尽可能多的 xy 对。
没有 built-in 设施与我想你问的类似。
但是,您当然可以自由循环任意数量的候选词(如 X
,或 most_similar()
的其他参数),以查看报告的内容 top-neighbors (候选 Y
值)- 可能应用一些相似性阈值。
请注意,著名的 man:king :: woman: _?_
通常在 Gensim 中以 most_similar(positive=['king', 'woman'], negative=['man'])
的形式呈现给 word2vec 模型,这相当于 king - man + woman = _?_
。对于任意 X
或响应 Y
.
,我不确定您的替代表述实际上 king - queen + X = Y
具有类比意义
并且请注意,most_similar()
禁止报告任何已经成为 positive
或 negative
参数的候选选区。通常,'artihmetic' 的结果仍然比其他任何东西都更接近输入词 - 但不会报告,而是显示 next-best 个词。
Gensim Word2Vec 提供了一个系统来推断类似关系,即与已经找到的那些具有“相同形状”的关系?
Es: 从国王、王后
开始我想得到其他男女性别的情侣。
换句话说: most_similar(正数=['king', X], 负数=['queen']) -> Y
我想找到尽可能多的 xy 对。
没有 built-in 设施与我想你问的类似。
但是,您当然可以自由循环任意数量的候选词(如 X
,或 most_similar()
的其他参数),以查看报告的内容 top-neighbors (候选 Y
值)- 可能应用一些相似性阈值。
请注意,著名的 man:king :: woman: _?_
通常在 Gensim 中以 most_similar(positive=['king', 'woman'], negative=['man'])
的形式呈现给 word2vec 模型,这相当于 king - man + woman = _?_
。对于任意 X
或响应 Y
.
king - queen + X = Y
具有类比意义
并且请注意,most_similar()
禁止报告任何已经成为 positive
或 negative
参数的候选选区。通常,'artihmetic' 的结果仍然比其他任何东西都更接近输入词 - 但不会报告,而是显示 next-best 个词。