如何过滤 elasticsearch 全局聚合?

How to filter an elasticsearch global aggregation?

我想要实现的目标:我希望我的 "age" 聚合不被查询过滤器过滤,并且我希望能够对其应用过滤器。

所以如果我从这个查询开始:

{
    "query":{
        "filtered":{
            "filter":{ "terms":{ "family_name":"Brown" } } //filter_1
        }
    },
    "aggs":{
        "young_age":{
            "filter":{
                "range":{ "lt":40, "gt":18 } //filter_2
            },
            "aggs":{
                "age":{
                    "terms":{
                        "field":"age"
                    }
                }
            }
        }
    }
}

我的聚合 "young_age" 将被 filter_1 和 filter_2 过滤。我不希望我的聚合被 filter_1.

过滤

在查看文档时,我认为全局聚合可以解决我的问题,因此我编写了该查询:

{
    "query":{
        "filtered":{
            "filter":{ "terms":{ "family_name":"Brown" } } //filter_1
        }
    },
    "aggs":{
        "young_age":{
            "global":{}, //<----------- add global
            "filter":{
                "range":{ "lt":40, "gt":18 } //filter_2
            },
            "aggs":{
                "age":{
                    "terms":{
                        "field":"age"
                    }
                }
            }
        }
    }
}

但是弹性搜索抱怨我的 filter_2:

""" 在[global]和[filter]中找到两个聚合类型定义[age] """

当然,如果我删除 filter_2:

{
    "query":{
        "filtered":{
            "filter":{
                "terms":{
                    "family_name":"Brown"
                }
            }
        }
    },
    "aggs":{
        "young_age":{
            "global":{},
            "aggs":{
                "age":{
                    "terms":{
                        "field":"age"
                    }
                }
            }
        }
    }
}

然后我的聚合将不会被 filter_1 过滤(如预期的那样)。

那么我应该如何将 filter_2 应用于我的全局聚合?或者我应该如何实现这一目标?我记得用 facet 过滤器写过类似的东西...

在我看来,这是 post_filter 的典型用例。正如文档所说:

The post_filter is applied to the search hits at the very end of a search request, after aggregations have already been calculated

您的查询将如下所示:

{
    "post_filter":{
       "terms":{
            "family_name":"Brown" //filter_1
        }
    },
   "aggs":{
        "young_age":{
            "filter":{
                "range":{ "lt":40, "gt":18 } //filter_2
            },
            "aggs":{
                "age":{
                    "terms":{
                        "field":"age"
                    }
                }
            }
        }
    }
}

在这种情况下,搜索命中是索引中的所有文档。然后计算聚合(在filter_1之前)。然后 post_filter 和 filter_1 将被执行。

编辑:正如您在表扬中所说,您有很多聚合,只有一个不应受到影响 filter_1 我使用全局聚合修复了您的查询

{
  "query": {
    "filtered": {
      "filter": {
        "term": {
          "family_name": "Brown"
        }
      }
    }
  },
  "aggs": {
    "young_age": {
      "global": {},
      "aggs": {
        "filter2": {
          "filter": {
            "range": {
              "lt": 40,
              "gt": 18
            }
          },
          "aggs": {
            "age": {
              "terms": {
                "field": "age"
              }
            }
          }
        }
      }
    }
  }
}

不允许在同一级别使用全局变量和过滤器。您必须将过滤器放在全局聚合的内部一级。

像这样的东西应该适合你。

{
    "query":{
        "filtered":{
            "filter":{
                "terms":{
                    "family_name":"Brown"
                }
            }
        }
    },
    "aggs":{
        "young_age":{
            "global":{},
            "aggs":{
                "filter": {"term": {"family_name": "Brown"}}, #or {"bool": {"filter": {"term": {"family_name": "Brown"}}}}
                "aggs": {
                    "age":{
                        "terms":{
                            "field":"age"
                        }
                    }
                }
            }
        }
    }
}