Elasticsearch 匹配与过滤器中的术语

Elasticsearch match vs. term in filter

我没有发现过滤器中的术语和匹配之间有任何区别:

POST /admin/_search
{
    "query": {
        "bool": {
            "filter": [
                {
                    "term": {
                        "partnumber": "j1knd"
                    }
                }
            ]
        }
    }
}

并且结果也包含不完全匹配的部件号,例如:“52527.J1KND-H”

为什么?

不分析术语查询,这意味着您发送的任何内容都将原样用于匹配倒排索引中的标记,同时分析匹配查询并将相同的分析器应用于索引时使用的字段并相应地匹配文档。

阅读有关 term query and match query 的更多信息。如匹配查询中所述:

Returns documents that match a provided text, number, date or boolean value. The provided text is analyzed before matching.

您还可以使用 analyze API 查看为特定字段生成的标记。

standard analyzer52527.J1KND-H 文本上生成的令牌。

POST /_analyze
{
    "text": "52527.J1KND-H",
    "analyzer" : "standard"
}

{
    "tokens": [
        {
            "token": "52527",
            "start_offset": 0,
            "end_offset": 5,
            "type": "<NUM>",
            "position": 0
        },
        {
            "token": "j1knd",
            "start_offset": 6,
            "end_offset": 11,
            "type": "<ALPHANUM>",
            "position": 1
        },
        {
            "token": "h",
            "start_offset": 12,
            "end_offset": 13,
            "type": "<ALPHANUM>",
            "position": 2
        }
    ]
}

上面向您解释了为什么您也得到了不完全匹配的 partnumbers,例如:“52527.J1KND-H”,我将以您的示例为例,以及您如何让它发挥作用。

索引映射

{
  "mappings": {
    "properties": {
      "partnumber": {
        "type": "text",
        "fields": {
          "raw": { 
            "type":  "keyword" --> note this
          }
        }
      }
    }
  }
}

索引文档

{
  "partnumber" : "j1knd"
}

{
  "partnumber" : "52527.J1KND-H"
}

搜索查询 return 仅完全匹配

{
    "query": {
        "bool": {
            "filter": [
                {
                    "term": {
                        "partnumber.raw": "j1knd" --> note `.raw` in field
                    }
                }
            ]
        }
    }

结果

 "hits": [
      {
        "_index": "so_match_term",
        "_type": "_doc",
        "_id": "2",
        "_score": 0.0,
        "_source": {
          "partnumber": "j1knd"
        }
      }
    ]

    }