Python 中的单词移动距离
Word Mover's Distance in Python
我正在尝试使用 WMD 计算 2 个文本的相似度。我尝试在 Python 3 中使用以下代码,使用 gensim:
word2vec_model = gensim.models.KeyedVectors.load_word2vec_format('GoogleNews-vectors-negative300.bin', binary=True)
word2vec_model.init_sims(replace=True) # normalizes vectors
distance = word2vec_model.wmdistance("string 1", "string 2") # Compute WMD as normal.
但是,我不认为这会返回正确的值。我应该如何在 python 中执行此操作?
请拆分字符串:
distance = word2vec_model.wmdistance("string 1".split(), "string 2".split())
>>> 0.4114476676950455
参数必须是字符串列表。
我正在尝试使用 WMD 计算 2 个文本的相似度。我尝试在 Python 3 中使用以下代码,使用 gensim:
word2vec_model = gensim.models.KeyedVectors.load_word2vec_format('GoogleNews-vectors-negative300.bin', binary=True)
word2vec_model.init_sims(replace=True) # normalizes vectors
distance = word2vec_model.wmdistance("string 1", "string 2") # Compute WMD as normal.
但是,我不认为这会返回正确的值。我应该如何在 python 中执行此操作?
请拆分字符串:
distance = word2vec_model.wmdistance("string 1".split(), "string 2".split())
>>> 0.4114476676950455
参数必须是字符串列表。