如何使用 gensim 工具包找到单词或多词释义的同义词

How do I find a synonym of a word or multi-word paraphrase using the gensim toolkit

使用 gensim 工具包加载了预训练的 word2vec 模型后,我想在给定上下文(例如 intelligent for 'she is a bright person'.

的情况下找到单词的同义词

有一种方法 [most_similar()][1] 可以根据模型坐标中的余弦相似性,将最接近的向量的词报告给给定的词。例如:

similars = loaded_w2v_model.most_similar('bright')

但是,Word2vec 不会找到严格意义上的同义词——只能找到在其训练语料库中与上下文相关的词。这些通常类似于同义词,但也可以在其他方面相似——例如在相同的主题领域中使用,或者能够在功能上相互替换。 (在最后一个方面,有时高度相似的词向量是针对 反义词 ,因为像 'hot' 和 'cold' 这样的词出现在相同的地方,指的是事物的相同方面。)

普通的 word2vec 也不能很好地处理多义词(像 'bright' 这样的标记既是 'well-lit' 的词又是 'smart' 的词)。因此 'bright' 的最相似词列表将包括其替代意义的混合。