运行 Hadoop 集群与边缘节点时如何连接到 Impala
How to connect to Impala when running Hadoop Cluster with Edge Nodes
我已经使用 Cloudera Manager 安装了 Hadoop 集群,目前 Impala 守护进程在所有数据节点上 运行。集群在 Gateway/Edge 个节点后面,边缘节点上只安装了网关服务(例如 httpfs、hive gateway、spark gateway、oozie)。
我想知道如何使用 Gateway/Edge 节点连接 Impala,因为所有 impala 守护进程都在集群的数据节点上 运行,并且没有服务暴露于 Gateway/Edge 节点。
您可以在边缘节点上安装 haproxy:
https://www.cloudera.com/documentation/enterprise/5-2-x/topics/impala_proxy.html
我已经使用 Cloudera Manager 安装了 Hadoop 集群,目前 Impala 守护进程在所有数据节点上 运行。集群在 Gateway/Edge 个节点后面,边缘节点上只安装了网关服务(例如 httpfs、hive gateway、spark gateway、oozie)。
我想知道如何使用 Gateway/Edge 节点连接 Impala,因为所有 impala 守护进程都在集群的数据节点上 运行,并且没有服务暴露于 Gateway/Edge 节点。
您可以在边缘节点上安装 haproxy:
https://www.cloudera.com/documentation/enterprise/5-2-x/topics/impala_proxy.html