Azure 搜索:仅 Blob 索引创建

Azure Search : Blob only Index Creation

我们只想为 Blob 数据启用 Azure 搜索,包括其内容和标记在 Blob 上的元属性。

是否可以在不引用数据库的情况下拥有这样的索引器和索引?在这种情况下如何指定索引的字段?这些字段是否与标记在 blob 上的元属性相同?

此外,我们的某些字段可能包含来自两种不同语言的数据。是否可以在索引中两次添加相同的字段,每次都指定不同的语言分析器?

是否可以将同一个索引器关联到两个不同的索引?

是否可以为同一索引指定多个存储帐户容器作为数据源?

理想情况下,我们希望能够做到以下几点;

  1. 在多个索引中使用相同的索引器
  2. 启用相同的 Indexer/Index 以便能够搜索多种语言(使用语言分析器)
  3. 启用仅基于 Blob 及其元属性数据的索引

本文档主题介绍了如何设置 blob 数据搜索:https://docs.microsoft.com/en-us/azure/search/search-howto-indexing-azure-blob-storage

默认的dataToExtract参数值为contentAndMetadata,这意味着所有文本内容和元数据都将被索引。您应该能够设置从元数据和内容到索引的字段映射(详细信息在同一文档主题中概述)。

索引器指向它应该输出到的索引,所以我认为不可能为多个索引重复使用同一个索引器,您必须改为复制它们。

同样,索引器指定从哪个数据源获取数据,因此每个索引器只有一个数据源。如果您想从多个来源的数据构建索引,您需要先将数据聚合到一个来源中。

通过为每个索引字段指定相关的分析器,可以在一个索引中索引多种语言。可以在本主题中找到更多详细信息:https://docs.microsoft.com/en-us/azure/search/search-language-support