Druid GroupBy 查询在按字段更改顺序时给出不同的响应

Druid GroupBy query gives different response when changing the order by fields

我有一个关于 Apache Druid 孵化查询的问题。

我有一个简单的分组 select 每个接线员的呼叫次数。在这里查看我的查询:

{
    "queryType": "groupBy",
    "dataSource": "ivr-calls",
    "intervals": [
        "2019-12-06T00:00:00.000Z/2019-12-07T00:00:00.000Z"
    ],
    "dimensions": [
        {
            "type": "lookup",
            "dimension": "operator_id",
            "outputName": "value",
            "name": "ivr_operator",
            "replaceMissingValueWith": "Unknown"
        },
        {
            "type": "default",
            "dimension": "operator_id",
            "outputType": "long",
            "outputName": "id"
        }
    ],
    "granularity": "all",
    "aggregations": [
        {
            "type": "longSum",
            "name": "calls",
            "fieldName": "calls"
        }
    ],
    "limitSpec": {
        "type": "default",
        "limit": 999999,
        "columns": [
            {
                "dimension": "value",
                "direction": "ascending",
                "dimensionOrder": "numeric"
            }
        ]
    }
}

在此查询中,我按 "value" 维度对结果进行排序,收到 218 个结果。 我注意到有些记录是重复的。 (我在我的结果集中看到一些运算符两次)。这很奇怪,因为根据我的经验,您 select 的所有维度也用于分组依据。所以,它们应该是独一无二的。

如果我将订单添加到 "id" 维度,我会收到 183 个结果(这是预期的):

"columns": [
    {
        "dimension": "value",
        "direction": "ascending",
        "dimensionOrder": "numeric"
    },
    {
        "dimension": "id",
        "direction": "ascending",
        "dimensionOrder": "numeric"
    }
]

文档没有告诉我关于这种奇怪行为的任何信息 (https://druid.apache.org/docs/latest/querying/limitspec.html)。

我之前使用druid的经验是o​​rder by只是"ordering".

我是运行德鲁伊版本0.15.0-incubating-iap9.

谁能告诉我为什么基于列排序的结果集会有所不同?

我通过指定订单中的所有列暂时解决了这个问题。

问题似乎与德鲁伊中的错误有关。参见:https://github.com/apache/incubator-druid/issues/9000