表意(中文)语言的 Azure 搜索通配符

Azure Search Wildcard on ideographic (Chinese) language

我们正在构建一个同时具有英文和中文字符的搜索引擎。英文搜索可以很好地使用通配符,例如wash* return 结果符合预期。使用通配符对仅中文搜索执行混合搜索失败。这里有两个例子:

示例 1:

以下查询将 return 匹配刮水但忽略 "frog*",删除 * 有效,但仅适用于完全匹配。

https://notarealurl.search.windows.net/indexes/parts/docs?api-version=2017-11-11&queryType=full&search=frog* 刮水

示例 2:

以下查询 return 没有结果,删除 * 即可正常工作。

https://notrealurl.search.windows.net/indexes/parts/docs?api-version=2017-11-11&queryType=full&search=刮水*

Azure Search有没有通配符搜索汉字的方法?

查询刮水*的预期结果是什么? 该字段配置了什么语言分析器。标准分析器将 CJK 单词分割成字符。你能尝试配置中文语言分析器吗?我建议在更改分析器之前阅读以下文档。

Analyzers for text processing in Azure Search

Language analyzers in Azure Search

如果需要自定义分析器,Custom analyzers in Azure Search