Apache Drill 查询 mongo 带有 IN() 运算符的数组字段类型

Apache Drill query mongo array field type with IN() operator

采用以下文档结构作为示例,我需要在其中执行 SELECT ... WHERE field IN(values) in drill.

{   "CD_MATRICULA" : 12,
    "USUARIO" : {
        "ID_SITUACAO" : 1,
        "PUBLICOALVO" : [ 84,85,86,87,88,89 ]
    }
},
{   "CD_MATRICULA" : 14,
    "USUARIO" : {
        "ID_SITUACAO" : 1,
        "PUBLICOALVO" : [ 90,91,92,93,94 ]
    }
},
{   "CD_MATRICULA" : 122,
    "USUARIO" : {
        "ID_SITUACAO" : 0,
        "PUBLICOALVO" : [ 20,300,400,500,600 ]
    }
}

要按 USUARIO.PUBLICOALVO 值查找文档,我可以使用下面的 mongo 查询:

db.getCollection('xxx').find({'USUARIO.PUBLICOALVO': {$in: [ 84, 85, 90, 94, 500 ]}})

它工作正常,通过列表的 IN() 比较返回所有文档。

但是,当我尝试在 DRILL 的 SQL 中执行相同的 mongo 查询时,我这样做:

SELECT * FROM xxx WHERE xxx.USUARIO.PUBLICOALVO IN(84, 85, 90, 94, 500);

但此查询失败,并显示消息:

Error in expression at index -1.  Error: Missing function implementation: [equal(INT-REPEATED, INT-REQUIRED)].  Full expression: --UNKNOWN EXPRESSION--.

如何在练习 sql 语法中编写过滤器之王 IN()?

非常感谢

Apache Drill 的 Mongo 存储插件不支持 IN 运算符。

original documentation for Apache Drill's Mongo storage plugin表示:

As of now, predicate pushdown is implemented for the following filters: >, >=, <, <=, ==, !=, isNull and isNotNull.

查看 latest version of the code 情况仍然如此:

switch (functionName) {
    case "equal":
      compareOp = MongoCompareOp.EQUAL;
      break;
    case "not_equal":
      compareOp = MongoCompareOp.NOT_EQUAL;
      break;
    case "greater_than_or_equal_to":
      compareOp = MongoCompareOp.GREATER_OR_EQUAL;
      break;
    case "greater_than":
      compareOp = MongoCompareOp.GREATER;
      break;
    case "less_than_or_equal_to":
      compareOp = MongoCompareOp.LESS_OR_EQUAL;
      break;
    case "less_than":
      compareOp = MongoCompareOp.LESS;
      break;
    case "isnull":
    case "isNull":
    case "is null":
      compareOp = MongoCompareOp.IFNULL;
      break;
    case "isnotnull":
    case "isNotNull":
    case "is not null":
      compareOp = MongoCompareOp.IFNOTNULL;
      break;
}

FWIW,IN 不是唯一不受支持的运算符; LIKE 运算符还不受支持,尽管有一个针对 Drill Mongo 存储插件的 open issue

所以你可以...

  • 自己实现 IN 运算符。 this issue 附带了一个补丁,它可能会提供一些有关如何实施 IN 运算符
  • 的指导
  • 针对指定 Component=Storage - MongoDB
  • Drill project 提出问题
  • 将您的 IN 实现为一系列 ORed equals,例如而不是 WHERE xxx.USUARIO.PUBLICOALVO IN (84, 85, 90, 94, 500) 你可以试试 WHERE xxx.USUARIO.PUBLICOALVO = 84 OR xxx.USUARIO.PUBLICOALVO=85 ...