计算预测句子和句子列表之间的句子相似度(使用 TF IDF)

Compute sentence similarity between predicted sentence and a list of sentences(Using TDIDF)

我正在尝试找到一种使用 TDIDF 的方法来查看 'new' 预测句子与生成它的列表的比较情况。

例如:

新发送。 =“你好世界”

然后我有一个句子列表,我想找到与新句子最相似的前 5 个句子。

我知道我需要对句子进行矢量化处理,但我如何才能为列表中的每个句子和 return 前 5 个最具可比性的句子打分。

Gensim(一个流行的 Python 文本建模库)文档的介绍 'Core Concepts' 部分显示 TFIDF-vectorization,然后创建一个辅助索引(它可以让您检查一个向量对一堆,列出最靠前的结果)。

参见:https://radimrehurek.com/gensim/auto_examples/core/run_core_concepts.html#core-concepts