Infer "shapes",或者推断Word2Vec中的类比关系

Infer "shapes", or infer analogous relations in Word2Vec

Gensim Word2Vec 提供了一个系统来推断类似关系,即与已经找到的那些具有“相同形状”的关系?

Es: 从国王、王后

开始

我想得到其他男女性别的情侣。

换句话说: most_similar(正数=['king', X], 负数=['queen']) -> Y

我想找到尽可能多的 xy 对。

没有 built-in 设施与我想你问的类似。

但是,您当然可以自由循环任意数量的候选词(如 X,或 most_similar() 的其他参数),以查看报告的内容 top-neighbors (候选 Y 值)- 可能应用一些相似性阈值。

请注意,著名的 man:king :: woman: _?_ 通常在 Gensim 中以 most_similar(positive=['king', 'woman'], negative=['man']) 的形式呈现给 word2vec 模型,这相当于 king - man + woman = _?_。对于任意 X 或响应 Y.

,我不确定您的替代表述实际上 king - queen + X = Y 具有类比意义

并且请注意,most_similar() 禁止报告任何已经成为 positivenegative 参数的候选选区。通常,'artihmetic' 的结果仍然比其他任何东西都更接近输入词 - 但不会报告,而是显示 next-best 个词。