索引存储在 Azure 认知搜索服务的哪个位置?

Where indices are stored behind Azure Cognitive Search service?

请选中此 tweet chain. I am working on a PoC using Azure Cognitive Search Service and I am comparing it with AWS. AWS seems to be using MongoDB Atlas 以存储索引,搜索功能基本上是基于 Mongo 的默认搜索功能,该功能基于 Apache Lucene 构建。我试图找出倒排索引是如何在 Azure 认知搜索的幕后存储的。他们使用 Apache Lucene 作为搜索引擎来搜索索引。

免责声明

此答案仅在 2020 年 7 月才被认为是准确的,因为实施细节确实发生了变化。此信息不是 material 哪个服务对于任何特定目的“更好”;只是为了好奇而有趣。

此外,请勿将我的回答视为任何类型的 API 合同或对未来功能或性能的承诺。我们封装了存储细节,这样您就不必担心它们,并且我们可以根据需要自由更改它们。

回答

A​​zure 认知搜索在后台使用 Apache Lucene,它管理倒排索引。截至撰写本文时,这些索引存储在由 page blobs 支持的 Azure 虚拟机磁盘上。所用磁盘的确切 SKU 取决于定价层和其他因素;我不会在这里详细介绍(因为它们确实会发生变化)。这些磁盘附加到 Azure 虚拟机,对于免费映射到你支付的“搜索单位”以外的定价层。