Azure Blob 索引器元数据字段,编码

Azure Blob Indexer metadata fields, encoding

我正在使用 Azure 搜索 Blob 索引器的预览版。所有应该被索引的信息都包含在 blob 元数据中。在进行测试时,我 运行 遇到元数据编码问题:

由于 Azure 存储 Blob 元数据值必须是有效的 HTTP Header 值,我们必须编码 non-ASCII 个字符(参见 Invalid character exception when adding Metadata to a CloudBlob). The standard encoding for http header values, if i researched correctly, is Mime Header Encoding (as stated in https://www.ietf.org/rfc/rfc2047.txt)。

这样做时,索引器将包含编码值,这不利于搜索。我还没有找到让 blob 索引器解码索引字段的这些值的方法,因为元数据字段是逐字添加的(来源:https://azure.microsoft.com/en-us/documentation/articles/search-howto-indexing-azure-blob-storage/#ContentSpecificMetadata

我知道 Azure Blob 索引器处于预览状态,但我试图记录我在尝试使用 Azure 搜索 Blob 索引器时 运行 遇到的一些问题!

这是我们的雷达。请为此 UserVoice suggestion 投票,以帮助我们确定这项工作的优先级。 我们可能会将其作为 base-64 解码功能来执行,因为 RFC2047 编码相对晦涩难懂。谢谢!