ES Analyzer 也标记数字,数字

ES Analyzer which tokens the numbers, digits as well

我正在使用 Elasticsearch 内置的简单分析器 https://www.elastic.co/guide/en/elasticsearch/reference/1.7/analysis-simple-analyzer.html,它使用 Lower Case Tokenizer。文本 apple 8 IS Awesome 被标记为以下格式。

 "apple",
 "is",
 "awesome"

你可以清楚地看到,它没有标记数字 8,因此现在如果我只使用 8 进行搜索,我的消息将不会出现在搜索中。

我浏览了 ES 提供的所有可用分析器,但找不到符合我要求的合适分析器。

如何使用 ES 的自定义或内置分析器将所有单词标记为数字?

您的问题是关于简单分析器的,但是您在文档中提到了一个非常古老的 link。尝试 https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-simple-analyzer.html

正如 Val 告诉您的那样,您可能正在寻找 standard analyser。 如果您想查看差异,请尝试 analysis api: