ES Analyzer 也标记数字,数字
ES Analyzer which tokens the numbers, digits as well
我正在使用 Elasticsearch 内置的简单分析器 https://www.elastic.co/guide/en/elasticsearch/reference/1.7/analysis-simple-analyzer.html,它使用 Lower Case Tokenizer。文本 apple 8 IS Awesome 被标记为以下格式。
"apple",
"is",
"awesome"
你可以清楚地看到,它没有标记数字 8
,因此现在如果我只使用 8
进行搜索,我的消息将不会出现在搜索中。
我浏览了 ES 提供的所有可用分析器,但找不到符合我要求的合适分析器。
如何使用 ES 的自定义或内置分析器将所有单词标记为数字?
您的问题是关于简单分析器的,但是您在文档中提到了一个非常古老的 link。尝试
https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-simple-analyzer.html
正如 Val 告诉您的那样,您可能正在寻找 standard analyser。
如果您想查看差异,请尝试 analysis api:
我正在使用 Elasticsearch 内置的简单分析器 https://www.elastic.co/guide/en/elasticsearch/reference/1.7/analysis-simple-analyzer.html,它使用 Lower Case Tokenizer。文本 apple 8 IS Awesome 被标记为以下格式。
"apple",
"is",
"awesome"
你可以清楚地看到,它没有标记数字 8
,因此现在如果我只使用 8
进行搜索,我的消息将不会出现在搜索中。
我浏览了 ES 提供的所有可用分析器,但找不到符合我要求的合适分析器。
如何使用 ES 的自定义或内置分析器将所有单词标记为数字?
您的问题是关于简单分析器的,但是您在文档中提到了一个非常古老的 link。尝试 https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-simple-analyzer.html
正如 Val 告诉您的那样,您可能正在寻找 standard analyser。 如果您想查看差异,请尝试 analysis api: