大文件(超过 32k)的全文索引
Full text indexing on large files (more than 32k)
是否可以对大小超过 32kB 的 blob 使用 Azure 搜索?我有大约 500GB 的文本文件作为 blob 存储在 Azure 上。平均 blob 大小约为 1MB。我非常兴奋地尝试使用 Azure 搜索对文件进行全文搜索。但是,看起来索引字段 Edm.String 不能超过 32kB。我在任何地方都找不到这个确切的限制,我从门户中的错误消息中提取了这个信息。
Azure 上是否有任何开箱即用的解决方案可用于在 Blob 上添加全文搜索功能? Azure 团队是否计划删除 32kB 字段大小?
这里可能有两个不同的限制:
Azure 搜索对从 blob 中提取的字符数有限制,具体取决于定价层。对于免费套餐,该限制为 32*1024 个字符。对于标准 S1 和 S2 定价层,它是 400 万个字符。
另外,搜索索引中单个术语的大小有限制 - 它也恰好是 32KB。如果搜索索引中的 content
字段标记为 filterable
、facetable
或 sortable
,那么您将达到此限制(无论该字段是否标记为 searchable
或不)。通常对于大型可搜索内容,您希望启用 searchable
,有时 retrievable
但不启用其余内容。这样你就不会从索引端达到内容长度的限制。
我们意识到现在没有记录第一个限制;我们很快就会在我们的配额和限制页面中反映这一点。
是否可以对大小超过 32kB 的 blob 使用 Azure 搜索?我有大约 500GB 的文本文件作为 blob 存储在 Azure 上。平均 blob 大小约为 1MB。我非常兴奋地尝试使用 Azure 搜索对文件进行全文搜索。但是,看起来索引字段 Edm.String 不能超过 32kB。我在任何地方都找不到这个确切的限制,我从门户中的错误消息中提取了这个信息。
Azure 上是否有任何开箱即用的解决方案可用于在 Blob 上添加全文搜索功能? Azure 团队是否计划删除 32kB 字段大小?
这里可能有两个不同的限制:
Azure 搜索对从 blob 中提取的字符数有限制,具体取决于定价层。对于免费套餐,该限制为 32*1024 个字符。对于标准 S1 和 S2 定价层,它是 400 万个字符。
另外,搜索索引中单个术语的大小有限制 - 它也恰好是 32KB。如果搜索索引中的
content
字段标记为filterable
、facetable
或sortable
,那么您将达到此限制(无论该字段是否标记为searchable
或不)。通常对于大型可搜索内容,您希望启用searchable
,有时retrievable
但不启用其余内容。这样你就不会从索引端达到内容长度的限制。
我们意识到现在没有记录第一个限制;我们很快就会在我们的配额和限制页面中反映这一点。