MongoDB聚合:多组+元素数组
MongoDB aggregate: multiple group + elements array
文档的结构如下所示:
"_id" : ObjectId("581496e8564627c098e41755"),
"startdate": somedate,
"enddate": somedate,
"userId" : 1,
"activity" : "activity1",
"measures" : [
{
"M1" : 99,
"M2" : 103,
"M3" : 118,
"M4" : 4
},
{
"M1" : 136,
"M2" : 89,
"M3" : 108,
"M4" : 6
},
...等等
有 50 个用户,8 种类型 activity,每个 activity 大约有 100 个措施。用户可以在另一个日期与其他措施具有相同的 activity。
我在数据库中有大约 3000 个文档:每个用户每个活动 1 个文档,带有度量。
我想根据 activity 所有度量获取每个用户。
我有以下代码:
`db.armband.aggregate([
{$match: { "measures.M1": { $gt: 1 } } },
{$project: { _id: 0, userId: 1, activity:1, measures:1 } },
{$sort: {userId:1, activity:1} },
{$out: "actPerUser"}
])
`
这里的问题是每个 activity 我按顺序得到 1 个文档。但我得到:
- 1 个用户 ID 为 1 的文档,activity1,度量值 100
- 1 个用户 ID 为 1 的文档,activity1,度量值 100
- 1 个用户 ID 为 2 的文档,activity1,度量值 100
我想要一份文件:
userid1,activity1,度量(activity 的所有度量 - 在上面的示例中为 200。)
然后我尝试了:
`db.armband.aggregate(
[
{
$group:
{
_id: { userId: "$userId" },
actMes: { $push: { activity:"$activity", measures: "$measures" } }
}
},
{$project: { _id: 0, userId: "$_id.userId", actMes:1 } },
{$sort: { userId:1}},
]
)
这为我提供了每个用户 1 个文档,其中包含不同的活动+措施(但仍然是双重活动)。
然后我尝试放松措施:
`db.armband.aggregate(
[
{$unwind: '$measures'},
{$group: {
_id: { userId: "$userId" },
activity: { $addToSet: "$activity" },
measures: {$addToSet: "$measures"}
}
},
{ $sort: {userId:1}}
])
`
这为我提供了 1 个文档,每个用户有 8 个活动,测量值约为 5900。
所以我有点迷茫我怎样才能实现我想要的?是否可能,1 个用户 1 个文档,1 个 activity,所有 activity 的度量?
您可以使用:
- 1
$unwind
删除数组
- 1
$group
按 activity/userId 分组并且 $push
测量到新创建的数组中
查询是:
db.armband.aggregate([{
"$unwind": "$measures"
}, {
$group: {
_id: {
userId: "$userId",
activity: "$activity"
},
measures: { $push: "$measures" }
}
}])
这给出了类似的东西:
{ "_id" : { "userId" : 2, "activity" : "activity1" }, "measures" : [ { "M1" : 99, "M2" : 103, "M3" : 118, "M4" : 4 }, { "M1" : 136, "M2" : 89, "M3" : 108, "M4" : 6 } ] }
{ "_id" : { "userId" : 2, "activity" : "activity2" }, "measures" : [ { "M1" : 99, "M2" : 103, "M3" : 118, "M4" : 4 }, { "M1" : 136, "M2" : 89, "M3" : 108, "M4" : 6 } ] }
{ "_id" : { "userId" : 1, "activity" : "activity1" }, "measures" : [ { "M1" : 99, "M2" : 103, "M3" : 118, "M4" : 4 }, { "M1" : 136, "M2" : 89, "M3" : 108, "M4" : 6 }, { "M1" : 99, "M2" : 103, "M3" : 118, "M4" : 4 }, { "M1" : 136, "M2" : 89, "M3" : 108, "M4" : 6 } ] }
文档的结构如下所示:
"_id" : ObjectId("581496e8564627c098e41755"),
"startdate": somedate,
"enddate": somedate,
"userId" : 1,
"activity" : "activity1",
"measures" : [
{
"M1" : 99,
"M2" : 103,
"M3" : 118,
"M4" : 4
},
{
"M1" : 136,
"M2" : 89,
"M3" : 108,
"M4" : 6
},
...等等
有 50 个用户,8 种类型 activity,每个 activity 大约有 100 个措施。用户可以在另一个日期与其他措施具有相同的 activity。 我在数据库中有大约 3000 个文档:每个用户每个活动 1 个文档,带有度量。
我想根据 activity 所有度量获取每个用户。
我有以下代码:
`db.armband.aggregate([
{$match: { "measures.M1": { $gt: 1 } } },
{$project: { _id: 0, userId: 1, activity:1, measures:1 } },
{$sort: {userId:1, activity:1} },
{$out: "actPerUser"}
])
`
这里的问题是每个 activity 我按顺序得到 1 个文档。但我得到:
- 1 个用户 ID 为 1 的文档,activity1,度量值 100
- 1 个用户 ID 为 1 的文档,activity1,度量值 100
- 1 个用户 ID 为 2 的文档,activity1,度量值 100
我想要一份文件: userid1,activity1,度量(activity 的所有度量 - 在上面的示例中为 200。)
然后我尝试了:
`db.armband.aggregate(
[
{
$group:
{
_id: { userId: "$userId" },
actMes: { $push: { activity:"$activity", measures: "$measures" } }
}
},
{$project: { _id: 0, userId: "$_id.userId", actMes:1 } },
{$sort: { userId:1}},
]
)
这为我提供了每个用户 1 个文档,其中包含不同的活动+措施(但仍然是双重活动)。
然后我尝试放松措施:
`db.armband.aggregate(
[
{$unwind: '$measures'},
{$group: {
_id: { userId: "$userId" },
activity: { $addToSet: "$activity" },
measures: {$addToSet: "$measures"}
}
},
{ $sort: {userId:1}}
])
`
这为我提供了 1 个文档,每个用户有 8 个活动,测量值约为 5900。
所以我有点迷茫我怎样才能实现我想要的?是否可能,1 个用户 1 个文档,1 个 activity,所有 activity 的度量?
您可以使用:
- 1
$unwind
删除数组 - 1
$group
按 activity/userId 分组并且$push
测量到新创建的数组中
查询是:
db.armband.aggregate([{
"$unwind": "$measures"
}, {
$group: {
_id: {
userId: "$userId",
activity: "$activity"
},
measures: { $push: "$measures" }
}
}])
这给出了类似的东西:
{ "_id" : { "userId" : 2, "activity" : "activity1" }, "measures" : [ { "M1" : 99, "M2" : 103, "M3" : 118, "M4" : 4 }, { "M1" : 136, "M2" : 89, "M3" : 108, "M4" : 6 } ] }
{ "_id" : { "userId" : 2, "activity" : "activity2" }, "measures" : [ { "M1" : 99, "M2" : 103, "M3" : 118, "M4" : 4 }, { "M1" : 136, "M2" : 89, "M3" : 108, "M4" : 6 } ] }
{ "_id" : { "userId" : 1, "activity" : "activity1" }, "measures" : [ { "M1" : 99, "M2" : 103, "M3" : 118, "M4" : 4 }, { "M1" : 136, "M2" : 89, "M3" : 108, "M4" : 6 }, { "M1" : 99, "M2" : 103, "M3" : 118, "M4" : 4 }, { "M1" : 136, "M2" : 89, "M3" : 108, "M4" : 6 } ] }