定义 Azure 搜索分数的阈值

Defining thresholds on Azure Search Score

azure-cognitive-search

全部，我们的应用程序中有一个案例，我们收集用户对从 Azure 搜索返回的匹配数据的满意度反馈。到目前为止，我们从有限的反馈中注意到，分数与用户满意度之间存在相关性（高分会导致更好的用户满意度，因为找到了更有用的匹配项）。当 Azure 搜索分数高于 2.5 时，这似乎会导致我们的应用程序获得满意评级。但我们不确定这是否只是巧合，也不确定这种方法是否合理。我们不知道 Azure 搜索分数的最大范围（例如 0-10）是多少。此外，link 似乎表明分数也会随着数据语料库的变化而变化（即使考虑到在我们的案例中使用相同的查询和不同的输入数据）。是否甚至可以在 Azure 上定义阈值在我们的应用程序中我们可以删除明显低分匹配并且根本不向用户显示它们的搜索分数？对此有什么建议吗？

谢谢。

对您链接的问题的回复是准确的。分值取决于索引中的语料库，因为它使用 "document frequency" 等变量，这取决于索引中的文档。因此，在两个不同索引的上下文中计算时，相同的查询文档对可能具有不同的分数。

该分数也没有任何特定范围，因为它不能用作在不同查询的结果之间进行比较的绝对值。评分值用于在同一索引内对文档与特定查询的相对相关性进行排名。

但是，由于分数是作为搜索结果的一部分返回的，所以没有什么可以阻止您在应用程序中使用自己的客户端过滤来忽略分数低于特定阈值的结果（如果您得出结论）在您的产品上下文中有意义。

定义 Azure 搜索分数的阈值

Defining thresholds on Azure Search Score

azure-cognitive-search