如何在没有小写的情况下使用 Elasticsearch 标准分析器

How to use Elasticsearch standard analyser without lower case

我正在尝试使用 "standard" 分析器的预设在 elasticsearch 中创建一个分析器,但有一个变化 - 单词没有小写。

我试过像这样链接空格和标准分析器:

PUT /standard_uppercase
{
"settings": {
"analysis": {
  "analyzer": {
    "rebuilt_standard": {
      "tokenizer": "standard",
      "filter": [
        "standard",
        "whitespace"       
      ]
    }
  }
}
}
}

但这并没有给出所需的结果。有没有办法只覆盖分析器的小写部分,但零售标准分析器的所有现有功能?

提前致谢。

根据documentation

Definition

The standard analyzer consists of:

Tokenizer

    Standard Tokenizer 

Token Filters

    Standard Token Filter
    Lower Case Token Filter
    Stop Token Filter (disabled by default)

所以,您可以通过这种方式实现您的目的:

PUT /standard_uppercase
{
  "settings": {
    "analysis": {
      "analyzer": {
        "rebuilt_standard": {
          "tokenizer": "standard",
          "filter": [
            "standard"   
          ]
        }
      }
    }
  }
}