在 elasticsearch 中,我如何标记由 space 分隔的单词并能够通过不使用 space 的输入进行匹配
In elasticsearc How can I Tokenize words separeted by space and be able to match by typing without space
这是我想要实现的目标:
我的字段值:"one two three"
我希望能够通过键入以下内容来匹配此字段:one or onetwo oronetwothree or onethree or twothree or two or three
为此,标记器需要生成这些标记:
一
一二
一二三
一三
二
二三
三
你知道如何实现这个分析器吗?
当我们将不同的单词连接成一个时,德语中存在同样的问题。为此,Elasticsearch 使用称为 "coumpound words" 的技术。还有一个名为 "compound word token filter" 的特定标记过滤器。它试图从字符串中的给定字典中查找子词。您只需为您的语言定义字典。 link 下面有完整的规范。
https://www.elastic.co/guide/en/elasticsearch/reference/5.5/analysis-compound-word-tokenfilter.html
这是我想要实现的目标:
我的字段值:"one two three" 我希望能够通过键入以下内容来匹配此字段:one or onetwo oronetwothree or onethree or twothree or two or three
为此,标记器需要生成这些标记: 一 一二 一二三 一三 二 二三 三
你知道如何实现这个分析器吗?
当我们将不同的单词连接成一个时,德语中存在同样的问题。为此,Elasticsearch 使用称为 "coumpound words" 的技术。还有一个名为 "compound word token filter" 的特定标记过滤器。它试图从字符串中的给定字典中查找子词。您只需为您的语言定义字典。 link 下面有完整的规范。 https://www.elastic.co/guide/en/elasticsearch/reference/5.5/analysis-compound-word-tokenfilter.html