Azure 搜索 - 搜索分数
Azure Search - Search Score
我目前正在使用 Azure 搜索在我的网站上执行产品搜索。
我有以下索引:
A:包含 55,000 个文档的索引
B: Inde with 16 documents
索引 B 中的所有文档都填充了索引 A 文档
当使用相同参数在 2 个索引中执行简单搜索时,结果不是我所期望的。
示例:
索引A:
查询字符串: search=kfc
结果按 search.score 降序排列:
ProductoName - search.score
肯德基产品 1 - 1.6514521
肯德基产品 2 - 1.5482594
索引 B:
查询字符串: search=kfc
结果按 search.score 降序排列:
ProductoName - search.score
肯德基产品 2 - 0.21555252
肯德基产品 1 - 0.13616839
我很惊讶搜索分数的结果顺序发生了变化,因为它们是完全相同的数据,只是文档数量发生了变化
影响搜索分数分配的文档数量?,您能否指出我可以在哪里阅读它,我查看了文档但没有找到任何相关信息
能否解释一下,如果是相同的信息,为什么会影响商品的排序? :(
Index 没有 Scoring Profile,完全相同的信息
您的分析是正确的,评分(以及排名)确实受到索引中文档数量的影响。为了计算分数,我们使用数据语料库的一些统计特征,例如整个语料库和每个文档中每个术语的频率。
文章 How full text search works in Azure Search explains this in great detail. In particular, the section on Scoring 介绍了如何使用频率(术语频率、文档频率)。
我目前正在使用 Azure 搜索在我的网站上执行产品搜索。
我有以下索引:
A:包含 55,000 个文档的索引
B: Inde with 16 documents
索引 B 中的所有文档都填充了索引 A 文档
当使用相同参数在 2 个索引中执行简单搜索时,结果不是我所期望的。
示例:
索引A:
查询字符串: search=kfc
结果按 search.score 降序排列:
ProductoName - search.score
肯德基产品 1 - 1.6514521
肯德基产品 2 - 1.5482594
索引 B:
查询字符串: search=kfc
结果按 search.score 降序排列:
ProductoName - search.score
肯德基产品 2 - 0.21555252
肯德基产品 1 - 0.13616839
我很惊讶搜索分数的结果顺序发生了变化,因为它们是完全相同的数据,只是文档数量发生了变化
影响搜索分数分配的文档数量?,您能否指出我可以在哪里阅读它,我查看了文档但没有找到任何相关信息
能否解释一下,如果是相同的信息,为什么会影响商品的排序? :(
Index 没有 Scoring Profile,完全相同的信息
您的分析是正确的,评分(以及排名)确实受到索引中文档数量的影响。为了计算分数,我们使用数据语料库的一些统计特征,例如整个语料库和每个文档中每个术语的频率。
文章 How full text search works in Azure Search explains this in great detail. In particular, the section on Scoring 介绍了如何使用频率(术语频率、文档频率)。