在 Apache Hadoop 和 Hive (Redhat) 上安装 Hue
Installation of Hue on Apache Hadoop and Hive (Redhat)
我有 运行 Hadoop 2.7 和 Hive 2.0.1。我正在尝试安装 Hive 编辑器,以便我可以轻松编写 HiveQL 查询。因此,我下载并构建了 Hue 3.10。我将其配置为与 HDFS 和 Hive 一起使用(我不确定它们是否正确)。当我启动 Hue 时,它会检查配置,我在 Hue
的服务器日志中看到一些与 webhdfs 相关的错误
[27/Jul/2016 23:08:55 -0700] webhdfs ERROR Failed to determine superuser of WebHdfs athttp://40.221.1.44:50070/webhdfs/v1/: <HTML><HEAD>
.....
.....
[27/Jul/2016 23:10:10 -0700] webhdfs INFO WebHdfs at http://40.221.1.44:50070/webhdfs/v1/ -- Validation error: <HTML><HEAD>
<TITLE>Network Error</TITLE>
<script type="text/javascript">document.location.href="http://fr0-proxy-vip.eu.ab.corp/error/page.php?id=tcp_error&proxy=fr0-proxylan-p01&summary=Network Error&url=40.221.1.44&category=none&user=&ip=40.221.1.44&details=A communication error occurred: "Operation timed out""</script>
<meta http-equiv="REFRESH" content="0;url='http://fr0-proxy-vip.eu.ab.corp/error/page.php?id=tcp_error&proxy=fr0-proxylan-p01&summary=Network Error&url=40.221.1.44&category=none&user=&ip=40.221.1.44&details=A communication error occurred: "Operation timed out"'">
</HEAD>
<BODY>
<FONT face="Helvetica">
<big><strong></strong></big><BR>
</FONT>
<blockquote>
<TABLE border=0 cellPadding=1 width="80%">
<TR><TD>
<FONT face="Helvetica">
<big>Network Error (tcp_error)</big>
<BR>
<BR>
</FONT>
</TD></TR>
<TR><TD>
<FONT face="Helvetica">
A communication error occurred: "Operation timed out"
</FONT>
</TD></TR>
<TR><TD>
<FONT face="Helvetica">
The Web Server may be down, too busy, or experiencing other problems preventing it from responding to requests. You may wish to try again at a later time.
</FONT>
</TD></TR>
<TR><TD>
<FONT face="Helvetica" SIZE=2>
<BR>
For assistance, contact the Service Desk (8666).
</FONT>
</TD></TR>
</TABLE>
</blockquote>
</FONT>
</BODY></HTML>
(error 503)
我的 hdfs 中有以下信息-site.xml
<property>
<name>dfs.webhdfs.enabled</name>
<value>true</value>
</property>
我不介意其他应用程序,但真正关心 Hadoop 和 Hive。任何帮助将不胜感激。
hdfs-site.xml
<configuration>
<property>
<name>dfs.webhdfs.enabled</name>
<value>true</value>
</property>
</configuration>
我的核心-site.xml
<property>
<name>hadoop.proxyuser.baamarna5617.hosts</name>
<value>*</value>
</property>
<property>
<name>hadoop.proxyuser.baamarna5617.groups</name>
<value>*</value>
</property>
我已经以用户 baamarna5617 安装了 hadoop。
当我启动 hue 浏览器时,我创建了一个名为 'baamarna5617' 的用户帐户。我在我的 hdfs 中创建了 /user/baamarna5617。
在我的 mapred-site.xml 中,我包含了以下几行
<property>
<name>jobtracker.thrift.address</name>
<value>0.0.0.0:9290</value>
</property>
<property>
<name>mapred.jobtracker.plugins</name>
<value>org.apache.hadoop.thriftfs.ThriftJobTrackerPlugin</value>
<description>Comma-separated list of jobtracker plug-ins to be activated.</description>
</property>
在我的 https-site.xml
<property>
<name>httpfs.proxyuser.hue.hosts</name>
<value>*</value>
</property>
<property>
<name>httpfs.proxyuser.hue.groups</name>
<value>*</value>
</property>
我的蜂巢-site.xml
<property>
<name>hive.hwi.listen.host</name>
<value>40.221.1.44</value>
</property>
<property>
<name>hive.server2.transport.mode</name>
<value>http</value>
</property>
<property>
<name>hive.server2.thrift.bind.host</name>
<value>40.221.1.44</value>
</property>
<property>
<name></name>
<value>http</value>
</property>
<property>
<name>hive.server2.webui.host</name>
<value>40.221.1.44</value>
</property>
<property>
<name>hive.server2.webui.port</name>
<value>10002</value>
</property>
<property>
<name>hive.server2.thrift.http.port</name>
<value>10001</value>
</property>
<property>
<name>hive.server2.thrift.http.path</name>
<value>cliservice</value>
</property>
<property>
<name>hive.server2.thrift.port</name>
<value>10000</value>
</property>
<property>
<name>hive.metastore.thrift.framed.transport.enabled</name>
<value>true</value>
</property>
<property>
<name>hive.metastore.warehouse.dir</name>
<value>/user/hive/warehouse</value>
</property>
现在更多信息:-
我正在做网络代理
我无法使用 webhdfs 成功创建目录。我可以列出 hdfs 目录并读取文件,但在 hdfs 中重命名文件和创建目录失败。
问题出在 curl 上。我升级并删除了所有代理集,它开始工作了。谢谢。
我有 运行 Hadoop 2.7 和 Hive 2.0.1。我正在尝试安装 Hive 编辑器,以便我可以轻松编写 HiveQL 查询。因此,我下载并构建了 Hue 3.10。我将其配置为与 HDFS 和 Hive 一起使用(我不确定它们是否正确)。当我启动 Hue 时,它会检查配置,我在 Hue
的服务器日志中看到一些与 webhdfs 相关的错误[27/Jul/2016 23:08:55 -0700] webhdfs ERROR Failed to determine superuser of WebHdfs athttp://40.221.1.44:50070/webhdfs/v1/: <HTML><HEAD>
.....
.....
[27/Jul/2016 23:10:10 -0700] webhdfs INFO WebHdfs at http://40.221.1.44:50070/webhdfs/v1/ -- Validation error: <HTML><HEAD>
<TITLE>Network Error</TITLE>
<script type="text/javascript">document.location.href="http://fr0-proxy-vip.eu.ab.corp/error/page.php?id=tcp_error&proxy=fr0-proxylan-p01&summary=Network Error&url=40.221.1.44&category=none&user=&ip=40.221.1.44&details=A communication error occurred: "Operation timed out""</script>
<meta http-equiv="REFRESH" content="0;url='http://fr0-proxy-vip.eu.ab.corp/error/page.php?id=tcp_error&proxy=fr0-proxylan-p01&summary=Network Error&url=40.221.1.44&category=none&user=&ip=40.221.1.44&details=A communication error occurred: "Operation timed out"'">
</HEAD>
<BODY>
<FONT face="Helvetica">
<big><strong></strong></big><BR>
</FONT>
<blockquote>
<TABLE border=0 cellPadding=1 width="80%">
<TR><TD>
<FONT face="Helvetica">
<big>Network Error (tcp_error)</big>
<BR>
<BR>
</FONT>
</TD></TR>
<TR><TD>
<FONT face="Helvetica">
A communication error occurred: "Operation timed out"
</FONT>
</TD></TR>
<TR><TD>
<FONT face="Helvetica">
The Web Server may be down, too busy, or experiencing other problems preventing it from responding to requests. You may wish to try again at a later time.
</FONT>
</TD></TR>
<TR><TD>
<FONT face="Helvetica" SIZE=2>
<BR>
For assistance, contact the Service Desk (8666).
</FONT>
</TD></TR>
</TABLE>
</blockquote>
</FONT>
</BODY></HTML>
(error 503)
我的 hdfs 中有以下信息-site.xml
<property>
<name>dfs.webhdfs.enabled</name>
<value>true</value>
</property>
我不介意其他应用程序,但真正关心 Hadoop 和 Hive。任何帮助将不胜感激。
hdfs-site.xml
<configuration>
<property>
<name>dfs.webhdfs.enabled</name>
<value>true</value>
</property>
</configuration>
我的核心-site.xml
<property>
<name>hadoop.proxyuser.baamarna5617.hosts</name>
<value>*</value>
</property>
<property>
<name>hadoop.proxyuser.baamarna5617.groups</name>
<value>*</value>
</property>
我已经以用户 baamarna5617 安装了 hadoop。
当我启动 hue 浏览器时,我创建了一个名为 'baamarna5617' 的用户帐户。我在我的 hdfs 中创建了 /user/baamarna5617。
在我的 mapred-site.xml 中,我包含了以下几行
<property>
<name>jobtracker.thrift.address</name>
<value>0.0.0.0:9290</value>
</property>
<property>
<name>mapred.jobtracker.plugins</name>
<value>org.apache.hadoop.thriftfs.ThriftJobTrackerPlugin</value>
<description>Comma-separated list of jobtracker plug-ins to be activated.</description>
</property>
在我的 https-site.xml
<property>
<name>httpfs.proxyuser.hue.hosts</name>
<value>*</value>
</property>
<property>
<name>httpfs.proxyuser.hue.groups</name>
<value>*</value>
</property>
我的蜂巢-site.xml
<property>
<name>hive.hwi.listen.host</name>
<value>40.221.1.44</value>
</property>
<property>
<name>hive.server2.transport.mode</name>
<value>http</value>
</property>
<property>
<name>hive.server2.thrift.bind.host</name>
<value>40.221.1.44</value>
</property>
<property>
<name></name>
<value>http</value>
</property>
<property>
<name>hive.server2.webui.host</name>
<value>40.221.1.44</value>
</property>
<property>
<name>hive.server2.webui.port</name>
<value>10002</value>
</property>
<property>
<name>hive.server2.thrift.http.port</name>
<value>10001</value>
</property>
<property>
<name>hive.server2.thrift.http.path</name>
<value>cliservice</value>
</property>
<property>
<name>hive.server2.thrift.port</name>
<value>10000</value>
</property>
<property>
<name>hive.metastore.thrift.framed.transport.enabled</name>
<value>true</value>
</property>
<property>
<name>hive.metastore.warehouse.dir</name>
<value>/user/hive/warehouse</value>
</property>
现在更多信息:-
我正在做网络代理
我无法使用 webhdfs 成功创建目录。我可以列出 hdfs 目录并读取文件,但在 hdfs 中重命名文件和创建目录失败。
问题出在 curl 上。我升级并删除了所有代理集,它开始工作了。谢谢。