如何通过 TF/IDF 分数获取文档中的单词列表
How to get a list of words in a doc by TF/IDF scores
我有一个 ElasticSearch 索引。给定索引中的文档 ID,我想通过 TF-IDF 分数获取文档中的单词列表。是否可以写一个ES查询来获取列表?
提前致谢。
您可以检索文档中所有术语的列表,然后在搜索文档中的所有词时使用解释。
例如:
如果文档包含 foo 和 bar,查询将是:
/MY_INDEX/MY_TYPE/_search?q=_id:MY_ID foo bar&explain=true&size=1
在评分说明中,您会看到每个词的idf评分和tf评分。
我有一个 ElasticSearch 索引。给定索引中的文档 ID,我想通过 TF-IDF 分数获取文档中的单词列表。是否可以写一个ES查询来获取列表?
提前致谢。
您可以检索文档中所有术语的列表,然后在搜索文档中的所有词时使用解释。
例如: 如果文档包含 foo 和 bar,查询将是:
/MY_INDEX/MY_TYPE/_search?q=_id:MY_ID foo bar&explain=true&size=1
在评分说明中,您会看到每个词的idf评分和tf评分。