apache drill 可以与cloudera hadoop 一起使用吗?

Can apache drill work with cloudera hadoop?

我正在尝试在分布式模式下设置 apache drill。我已经有一个 master 和 2 个 slaves 的 cloudera hadoop 集群。从关于 apache drill 的文档来看,它是否可以使用典型的 cloudera 集群进行设置还不太清楚。我找不到任何相关文章。任何形式的帮助将不胜感激。

Drill 可以与 Cloudera 一起独立安装在集群的节点上 - 并且能够查询 HDFS 上的文件。 有关安装详细信息,请参阅 link - https://cwiki.apache.org/confluence/display/DRILL/Deploying+Apache+Drill+in+a+Clustered+Environment

我在 cloudera hadoop 发行版中使用了它。我已经安装了包含所有服务的 cloudera 集群 运行。

执行以下步骤:

  1. 在集群的所有节点上安装 apache drill。
  2. 运行 drill/bin/drillbit.sh 在每个节点上。
  3. 使用 host:8047 上的 apache drill web 界面为 dfs 配置存储插件。在此处更新 HDFS 配置。
  4. 运行 sqlline : ./sqlline -u jdbc:drill:zk=host1:2181,host2:2181,host3:2181 (2181是zookeeper使用的端口号。)

它可能只适用于基本的不安全集群,因为 Drill 目前没有经过测试/记录以与 HDFS + Kerberos 集成以实现安全的 Hadoop 集群。投票并返回查看此票以获得 Drill 安全 HDFS 支持:

https://issues.apache.org/jira/browse/DRILL-3584