使用 hadoop 的 Apache Tez 配置

Apache Tez configuration with hadoop

这是我所做的简而言之:

第 1 步: 我已经在笔记本电脑(单节点)上成功配置了 hadoop 2.6 和 运行 示例 mapreduce 作业。

第 2 步: 我克隆了 tez 存储库并成功构建了 0.8.0 版本并将 jar 文件复制到 HDFS 并导出了所需的变量。我还在 mapred-site.xml.

中将变量 mapreduce.framework.name 的值更改为 yarn-tez

但是当我想要 运行 一个 tez orderedwordcount 作业时,我得到了这个错误:

15/07/04 18:45:03 INFO ipc.Client: Retrying connect to server: hostname/hostIP:57339. 
Already tried 9 time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=10, sleepTime=1000 MILLISECONDS)
15/07/04 18:45:12 INFO client.DAGClientImpl: DAG completed. FinalState=FAILED

我检查了资源管理器,它正在侦听端口 8030。 但客户端似乎试图连接到 运行dom 端口。正确吗?

我该怎么做才能让它正常工作?

看来是这个版本(0.8.0)连接资源管理器的问题。我编译并集成了以前的稳定版本 (0.7.0),现在一切都很好。希望他们能解决问题。

从您的日志来看,似乎是防火墙问题,而不是 Tez 版本问题。而且这与 Tez 无关,即使你 运行 Hadoop 只有你可以面对这个。

Hadoop 使用多个端口与客户端和服务组件之间进行通信。要启用 Hadoop 通信,请打开 Hadoop 使用的特定端口。 要打开特定端口,您可以在 Windows 中设置访问规则。例如,以下命令将在活动 Windows 防火墙中打开端口 80:

netsh advfirewall 防火墙添加规则名称=AllowRPCCommunication dir=in action=allow protocol=TCP localport=80

更多信息请看这里http://docs.hortonworks.com/HDPDocuments/HDP2/HDP-2.3.0-Win/bk_HDP_Install_Win/content/ref-79239257-778e-42a9-9059-d982d0c08885.1.html