MongoDB 聚合查询分组依据

MongoDB Aggregate Query Group By

假设我有一个包含以下信息的 MongoDB 集合:

{
  cust_id: "abc123",
  ord_date: ISODate("2012-11-02T17:04:11.102Z"),
  state: 'CA',
  price: 50,
  item: apple,
  color: red
}
{
  cust_id: "abc123",
  ord_date: ISODate("2012-11-02T17:04:11.102Z"),
  state: 'WA',
  price: 25,
  item: apple,
  color: green
}
{
  cust_id: "abc123",
  ord_date: ISODate("2012-11-02T17:04:11.102Z"),
  state: 'CA',
  price: 75,
  item: orange,
  color: orange
}
{
  cust_id: "def456",
  ord_date: ISODate("2012-11-02T17:04:11.102Z"),
  state: 'OR',
  price: 75,
  item: apple,
  color: red
}

我想对按州分组的订单总价进行汇总,其中商品为 'apple',颜色为 'red'。我的查询是:

{
  $match: {$and: [{item : "apple"}, {color : "red"}]},
  $group: {_id: {state: "$state", cust_id: "$cust_id"}, total: {$sum: "$price"}}
}

但是,我希望我的结果 cust_id 包含在 _id 中是一个 array/map/some 结构,其中包含构成我的总计的所有客户 ID 的列表。因此我希望我的输出包含

cust_id {'abc123', 'def456'}

有没有办法解决这个问题 mongo aggregate/querying?或者也许是构建此查询的更好方法,以便我可以计算按州分组的红苹果的总成本,并包括属于该类别的所有客户?我将它放在 _id 部分以提取信息,但将任何这些数据包含在那里并不重要。我只想要一种按州分组并使用上述聚合选择获取所有客户 ID 的集合的方法。

是的,在您的聚合 $group pipeline you can use the $addToSet 聚合运算符中将 cust_id 添加到数组中,同时您仍然可以按状态分组:

db.collection.aggregate([
    {
        "$match": {
            "item": "apple", 
            "color" : "red"
        }
    },
    {
        "$group": {
            "_id": "$state",
            "cust_id": {
                "$addToSet": "$cust_id"
            },
            "total": {
                "$sum": "$price"
            }
        }
    }
]);

输出:

/* 1 */
{
    "result" : [ 
        {
            "_id" : "OR",
            "cust_id" : [ 
                "def456"
            ],
            "total" : 75
        }, 
        {
            "_id" : "CA",
            "cust_id" : [ 
                "abc123"
            ],
            "total" : 50
        }
    ],
    "ok" : 1
}