kairosdb 聚合分组依据
kairosdb aggregate group by
我的 kairosdb 中有一年的 15 分钟间隔数据。我需要按顺序做以下事情:
- 使用标签过滤数据
- 使用几个标签对过滤后的数据进行分组。我没有指定标签的值,因为我希望它们在 运行 时间自动按标签值分组。
- 一旦对这些标签进行分组,我想将 15 分钟间隔数据汇总到一个月中。
我根据 kairosdb google 代码论坛上可用的信息,从 python 脚本向 运行 写了这个查询。但汇总值似乎不正确。输出似乎有偏差。我想了解我哪里出错了。我在 python 中这样做。这是我的 json 查询:
agg_query = {
"start_absolute": 1412136000000,
"end_absolute": 1446264000000,
"metrics":[
{
"tags": {
"insert_date": ["11/17/2015"]
},
"name": "gb_demo",
"group_by": [
{
"name": "time",
"range_size": {
"value": "1",
"unit": "months"
},
"group_count": "12"
},
{
"name": "tag",
"tags": ["usage_kind","building_snapshot_id","usage_point_id","interval"]
}
],
"aggregators": [
{
"name": "sum",
"sampling": {
"value": 1,
"unit": "months"
}
}
]
}
]
}
供参考:数据是这样的:
[[1441065600000,53488],[1441066500000,43400],[1441067400000,44936],[1441068300000,48736],[1441069200000,000000,000,472] 1441072800000,28936],[1441073700000,34896],[1441074600000,29216],[1441075500000,26040],[1441076400000,000,000,000,24224] 27824],[1441080900000,27960],[1441081800000,28056],[1441082700000,29264],[1441083600000,000,33272] ,[1441088100000,28944],[1443657600000,42112],[1443658500000,36712],[1443659400000,38440],[1443660300000,38824],[1443661200000,43440],[1443662100000,42632],[1443663000000,42984],[ 1443663900000,42952],[1443664800000,36112],[1443665700000,33680],[1443666600000,33376],[1443667500000,28616],[1443668400000,31688],[1443669300000,30872],[1443670200000,28200],[1443671100000, 27792],[1443672000000,27464],[1443672900000,27240],[1443673800000,27760],[14436747 00000,27232],[1443675600000,27824],[1443676500000,27264],[1443677400000,27328],[1443678300000,27576],[1443679200000,27136,[144679200000,27136],[140=81560]=1
这是 2015 年 9 月和 10 月的一些数据的快照。当我 运行 这个时,如果我给出 9 月的开始时间戳,它会正确地总结 9 月的数据,但对于 10 月它不会。
我相信您按时间分组会按日历月(1 月到 12 月)创建分组,但是您的总和聚合器将按开始日期开始的 运行 个月对值求和...这看起来有点奇怪.这会是你看到的原因吗?
数据是什么样的?聚合结果是什么样的?
我的 kairosdb 中有一年的 15 分钟间隔数据。我需要按顺序做以下事情: - 使用标签过滤数据 - 使用几个标签对过滤后的数据进行分组。我没有指定标签的值,因为我希望它们在 运行 时间自动按标签值分组。 - 一旦对这些标签进行分组,我想将 15 分钟间隔数据汇总到一个月中。
我根据 kairosdb google 代码论坛上可用的信息,从 python 脚本向 运行 写了这个查询。但汇总值似乎不正确。输出似乎有偏差。我想了解我哪里出错了。我在 python 中这样做。这是我的 json 查询:
agg_query = {
"start_absolute": 1412136000000,
"end_absolute": 1446264000000,
"metrics":[
{
"tags": {
"insert_date": ["11/17/2015"]
},
"name": "gb_demo",
"group_by": [
{
"name": "time",
"range_size": {
"value": "1",
"unit": "months"
},
"group_count": "12"
},
{
"name": "tag",
"tags": ["usage_kind","building_snapshot_id","usage_point_id","interval"]
}
],
"aggregators": [
{
"name": "sum",
"sampling": {
"value": 1,
"unit": "months"
}
}
]
}
]
}
供参考:数据是这样的: [[1441065600000,53488],[1441066500000,43400],[1441067400000,44936],[1441068300000,48736],[1441069200000,000000,000,472] 1441072800000,28936],[1441073700000,34896],[1441074600000,29216],[1441075500000,26040],[1441076400000,000,000,000,24224] 27824],[1441080900000,27960],[1441081800000,28056],[1441082700000,29264],[1441083600000,000,33272] ,[1441088100000,28944],[1443657600000,42112],[1443658500000,36712],[1443659400000,38440],[1443660300000,38824],[1443661200000,43440],[1443662100000,42632],[1443663000000,42984],[ 1443663900000,42952],[1443664800000,36112],[1443665700000,33680],[1443666600000,33376],[1443667500000,28616],[1443668400000,31688],[1443669300000,30872],[1443670200000,28200],[1443671100000, 27792],[1443672000000,27464],[1443672900000,27240],[1443673800000,27760],[14436747 00000,27232],[1443675600000,27824],[1443676500000,27264],[1443677400000,27328],[1443678300000,27576],[1443679200000,27136,[144679200000,27136],[140=81560]=1
这是 2015 年 9 月和 10 月的一些数据的快照。当我 运行 这个时,如果我给出 9 月的开始时间戳,它会正确地总结 9 月的数据,但对于 10 月它不会。
我相信您按时间分组会按日历月(1 月到 12 月)创建分组,但是您的总和聚合器将按开始日期开始的 运行 个月对值求和...这看起来有点奇怪.这会是你看到的原因吗?
数据是什么样的?聚合结果是什么样的?