天蓝色搜索性能问题

azure search performance issue

我在 Azure 搜索中建立了索引。该索引包含多个字段,但我标记为可搜索的字段中只有 2 个。 该索引有各种大小的全字 pdf 文件(当然是它们的文本)及其目的,可以用于文档搜索。

索引很大 - 160k 文档和 7.2 GB 大小。

当我查询直到 2 个字母时,一切正常,但当我输入复杂的单词时,性能很差。

例如:短语 - elasti 用了 59 秒。

在我的查询中 - 我使用过滤器、评分个人资料突出显示

经过一些调查 - 我发现是突出显示功能导致了问题。

有什么想法吗?如何提高性能 - 也许在索引中分成几个字段或类似的东西?

您的猜测是正确的 - 搜索突出显示导致此处出现问题。启用突出显示后,Azure 搜索会在 查询时间 处理结果集中的每个 item/text 以查找包含搜索命中的文本段。如果每个文本为 4.5mb (7.2gb/160k),则该过程可能需要很长时间。对于需要较长时间的复杂术语或短语,那是因为 Azure 搜索在找到足够数量的段后停止处理结果。我在 Azure 搜索团队工作。我会查看代码并确认。

我们本周部署了一项改进荧光笔性能的更改。需要重新索引才能启用该功能。如果问题仍然存在,请随时通过 nateko@microsoft.com 直接与我联系。再次感谢您的宝贵时间。

内特