运行 Hadoop 集群与边缘节点时如何连接到 Impala

How to connect to Impala when running Hadoop Cluster with Edge Nodes

我已经使用 Cloudera Manager 安装了 Hadoop 集群,目前 Impala 守护进程在所有数据节点上 运行。集群在 Gateway/Edge 个节点后面,边缘节点上只安装了网关服务(例如 httpfs、hive gateway、spark gateway、oo​​zie)。

我想知道如何使用 Gateway/Edge 节点连接 Impala,因为所有 impala 守护进程都在集群的数据节点上 运行,并且没有服务暴露于 Gateway/Edge 节点。

您可以在边缘节点上安装 haproxy:

https://www.cloudera.com/documentation/enterprise/5-2-x/topics/impala_proxy.html