Elasticsearch 在顶级聚合中包含其他字段

Question

我的索引文档如下：

{
  "user": { 
     "email": "test@test.com",
     "firstName": "test",
     "lastName": "test" 
  },
  ...
  "category": "test_category"
}

目前我有一个聚合，它按用户的电子邮件计算文档，然后是一个子聚合来计算每个用户的类别：

"aggs": {
  "users": {
    "terms": {
      "field": "user.email",
      "order": {
        "_count": "desc"
      }
    },
    "aggs": {
      "categories": {
        "terms": {
          "field": "category",
          "order": {
            "_count": "desc"
          }
        }
      }
    }
  }
}

我正在尝试将用户的名字和姓氏包含到顶级聚合生成的存储桶中，同时仍然从类别子聚合中获得相同的结果。我试过包括 top_hits 聚合，但我没有运气得到我想要的结果。

有什么建议吗？谢谢！

编辑：

让我换个说法。我实际上确实通过 top_hits 聚合在用户数据方面得到了预期的结果，我只是不知道如何将它正确地包含在我的原始聚合中，以便 categories 子聚合仍然给我同样的结果。我尝试了以下 top_hits 聚合：

"aggs": {
  "user": {
    "top_hits": {
      "size": 1,
      "_source": {
        "include": ["user"]
      }
    }
  }
}

我想将用户数据放在顶级聚合桶中，然后仍然在其下方按类别进行聚合。

Answer 1

如果我没看错，用户名和姓氏是双射的。

因此您可以在这些字段上使用自定义脚本检索它们（并在客户端使用“_”或任何分隔符提取这些存储桶值）

aggs: {
  users: {
    terms: {
        script: 'doc["users.email"].value + "_" + doc["users.firstName"].value + "_" + doc["users.lastName"].value'
    }
  }
}

Elasticsearch 在顶级聚合中包含其他字段

Elasticsearch include other fields in top level aggregation

elasticsearch

elasticsearch-aggregation