如何通过 TF/IDF 分数获取文档中的单词列表

How to get a list of words in a doc by TF/IDF scores

我有一个 ElasticSearch 索引。给定索引中的文档 ID,我想通过 TF-IDF 分数获取文档中的单词列表。是否可以写一个ES查询来获取列表?

提前致谢。

您可以检索文档中所有术语的列表,然后在搜索文档中的所有词时使用解释。

例如: 如果文档包含 foo 和 bar,查询将是:

/MY_INDEX/MY_TYPE/_search?q=_id:MY_ID foo bar&explain=true&size=1

在评分说明中,您会看到每个词的idf评分和tf评分。