Druid GroupBy 查询在按字段更改顺序时给出不同的响应
Druid GroupBy query gives different response when changing the order by fields
我有一个关于 Apache Druid 孵化查询的问题。
我有一个简单的分组 select 每个接线员的呼叫次数。在这里查看我的查询:
{
"queryType": "groupBy",
"dataSource": "ivr-calls",
"intervals": [
"2019-12-06T00:00:00.000Z/2019-12-07T00:00:00.000Z"
],
"dimensions": [
{
"type": "lookup",
"dimension": "operator_id",
"outputName": "value",
"name": "ivr_operator",
"replaceMissingValueWith": "Unknown"
},
{
"type": "default",
"dimension": "operator_id",
"outputType": "long",
"outputName": "id"
}
],
"granularity": "all",
"aggregations": [
{
"type": "longSum",
"name": "calls",
"fieldName": "calls"
}
],
"limitSpec": {
"type": "default",
"limit": 999999,
"columns": [
{
"dimension": "value",
"direction": "ascending",
"dimensionOrder": "numeric"
}
]
}
}
在此查询中,我按 "value" 维度对结果进行排序,收到 218 个结果。
我注意到有些记录是重复的。 (我在我的结果集中看到一些运算符两次)。这很奇怪,因为根据我的经验,您 select 的所有维度也用于分组依据。所以,它们应该是独一无二的。
如果我将订单添加到 "id" 维度,我会收到 183 个结果(这是预期的):
"columns": [
{
"dimension": "value",
"direction": "ascending",
"dimensionOrder": "numeric"
},
{
"dimension": "id",
"direction": "ascending",
"dimensionOrder": "numeric"
}
]
文档没有告诉我关于这种奇怪行为的任何信息 (https://druid.apache.org/docs/latest/querying/limitspec.html)。
我之前使用druid的经验是order by只是"ordering".
我是运行德鲁伊版本0.15.0-incubating-iap9.
谁能告诉我为什么基于列排序的结果集会有所不同?
我通过指定订单中的所有列暂时解决了这个问题。
问题似乎与德鲁伊中的错误有关。参见:https://github.com/apache/incubator-druid/issues/9000
我有一个关于 Apache Druid 孵化查询的问题。
我有一个简单的分组 select 每个接线员的呼叫次数。在这里查看我的查询:
{
"queryType": "groupBy",
"dataSource": "ivr-calls",
"intervals": [
"2019-12-06T00:00:00.000Z/2019-12-07T00:00:00.000Z"
],
"dimensions": [
{
"type": "lookup",
"dimension": "operator_id",
"outputName": "value",
"name": "ivr_operator",
"replaceMissingValueWith": "Unknown"
},
{
"type": "default",
"dimension": "operator_id",
"outputType": "long",
"outputName": "id"
}
],
"granularity": "all",
"aggregations": [
{
"type": "longSum",
"name": "calls",
"fieldName": "calls"
}
],
"limitSpec": {
"type": "default",
"limit": 999999,
"columns": [
{
"dimension": "value",
"direction": "ascending",
"dimensionOrder": "numeric"
}
]
}
}
在此查询中,我按 "value" 维度对结果进行排序,收到 218 个结果。 我注意到有些记录是重复的。 (我在我的结果集中看到一些运算符两次)。这很奇怪,因为根据我的经验,您 select 的所有维度也用于分组依据。所以,它们应该是独一无二的。
如果我将订单添加到 "id" 维度,我会收到 183 个结果(这是预期的):
"columns": [
{
"dimension": "value",
"direction": "ascending",
"dimensionOrder": "numeric"
},
{
"dimension": "id",
"direction": "ascending",
"dimensionOrder": "numeric"
}
]
文档没有告诉我关于这种奇怪行为的任何信息 (https://druid.apache.org/docs/latest/querying/limitspec.html)。
我之前使用druid的经验是order by只是"ordering".
我是运行德鲁伊版本0.15.0-incubating-iap9.
谁能告诉我为什么基于列排序的结果集会有所不同?
我通过指定订单中的所有列暂时解决了这个问题。
问题似乎与德鲁伊中的错误有关。参见:https://github.com/apache/incubator-druid/issues/9000