聚合的弹性搜索百分位数

elastic search percentile of aggregation

我有一个包含 3 个字段的索引:user_id、计数、时间戳。

我希望能够按 user_id 汇总计数,这使用弹性搜索很容易,但是,我还希望能够对结果数据进行百分位排名。

这可能吗?

是的,可以使用 Pipelined Percentiles Bucket Aggregation 实现,这是一个兄弟管道聚合,计算兄弟聚合中指定指标的所有桶的百分位数。指定的指标必须是数字,兄弟聚合必须是多桶聚合。

一个 percentiles_bucket 聚合单独看起来像这样:

{
    "percentiles_bucket": {
        "buckets_path": "the_sum"
    }
}

以下代码段计算所有每月总销售额的总和:

{
    "aggs" : {
        "sales_per_month" : {
            "date_histogram" : {
                "field" : "date",
                "interval" : "month"
            },
            "aggs": {
                "sales": {
                    "sum": {
                        "field": "price"
                    }
                }
            }
        },
        "sum_monthly_sales": {
            "percentiles_bucket": {
                "buckets_paths": "sales_per_month>sales", 
                "percents": [ 25.0, 50.0, 75.0 ] 
            }
        }
    }
}

下面可能是响应:

{
   "aggregations": {
      "sales_per_month": {
         "buckets": [
            {
               "key_as_string": "2015/01/01 00:00:00",
               "key": 1420070400000,
               "doc_count": 3,
               "total_sales": {
                   "value": 50
               },
               "t-shirts": {
                   "doc_count": 2,
                   "sales": {
                       "value": 10
                   }
               },
               "t-shirt-percentage": {
                   "value": 20
               }
            },
            {
               "key_as_string": "2015/02/01 00:00:00",
               "key": 1422748800000,
               "doc_count": 2
               "total_sales": {
                   "value": 60
               },
               "t-shirts": {
                   "doc_count": 1,
                   "sales": {
                       "value": 15
                   }
               },
               "t-shirt-percentage": {
                   "value": 25
               }
            }
         ]
      }
   }
}