Elasticsearch 在顶级聚合中包含其他字段
Elasticsearch include other fields in top level aggregation
我的索引文档如下:
{
"user": {
"email": "test@test.com",
"firstName": "test",
"lastName": "test"
},
...
"category": "test_category"
}
目前我有一个聚合,它按用户的电子邮件计算文档,然后是一个子聚合来计算每个用户的类别:
"aggs": {
"users": {
"terms": {
"field": "user.email",
"order": {
"_count": "desc"
}
},
"aggs": {
"categories": {
"terms": {
"field": "category",
"order": {
"_count": "desc"
}
}
}
}
}
}
我正在尝试将用户的名字和姓氏包含到顶级聚合生成的存储桶中,同时仍然从类别子聚合中获得相同的结果。我试过包括 top_hits
聚合,但我没有运气得到我想要的结果。
有什么建议吗?谢谢!
编辑:
让我换个说法。我实际上确实通过 top_hits
聚合在用户数据方面得到了预期的结果,我只是不知道如何将它正确地包含在我的原始聚合中,以便 categories
子聚合仍然给我同样的结果。我尝试了以下 top_hits
聚合:
"aggs": {
"user": {
"top_hits": {
"size": 1,
"_source": {
"include": ["user"]
}
}
}
}
我想将用户数据放在顶级聚合桶中,然后仍然在其下方按类别进行聚合。
如果我没看错,用户名和姓氏是双射的。
因此您可以在这些字段上使用自定义脚本检索它们(并在客户端使用“_”或任何分隔符提取这些存储桶值)
aggs: {
users: {
terms: {
script: 'doc["users.email"].value + "_" + doc["users.firstName"].value + "_" + doc["users.lastName"].value'
}
}
}
我的索引文档如下:
{
"user": {
"email": "test@test.com",
"firstName": "test",
"lastName": "test"
},
...
"category": "test_category"
}
目前我有一个聚合,它按用户的电子邮件计算文档,然后是一个子聚合来计算每个用户的类别:
"aggs": {
"users": {
"terms": {
"field": "user.email",
"order": {
"_count": "desc"
}
},
"aggs": {
"categories": {
"terms": {
"field": "category",
"order": {
"_count": "desc"
}
}
}
}
}
}
我正在尝试将用户的名字和姓氏包含到顶级聚合生成的存储桶中,同时仍然从类别子聚合中获得相同的结果。我试过包括 top_hits
聚合,但我没有运气得到我想要的结果。
有什么建议吗?谢谢!
编辑:
让我换个说法。我实际上确实通过 top_hits
聚合在用户数据方面得到了预期的结果,我只是不知道如何将它正确地包含在我的原始聚合中,以便 categories
子聚合仍然给我同样的结果。我尝试了以下 top_hits
聚合:
"aggs": {
"user": {
"top_hits": {
"size": 1,
"_source": {
"include": ["user"]
}
}
}
}
我想将用户数据放在顶级聚合桶中,然后仍然在其下方按类别进行聚合。
如果我没看错,用户名和姓氏是双射的。
因此您可以在这些字段上使用自定义脚本检索它们(并在客户端使用“_”或任何分隔符提取这些存储桶值)
aggs: {
users: {
terms: {
script: 'doc["users.email"].value + "_" + doc["users.firstName"].value + "_" + doc["users.lastName"].value'
}
}
}