Hadoop 集群中的主节点崩溃

Master node in Hadoop cluster is crashed

我正在使用 10 节点集群,主节点遇到硬件崩溃,导致包括 ambari 服务器在内的所有服务都无法访问。

我无法访问 HDFS,也无法登录到 ambari。

据说当 Master ndoe 宕机时,SNAMEnode 将接管,但在这种情况下,当 master 无法访问时 none 的服务似乎是 运行。整个集群都宕机了,如何进一步挽救集群?或者这表明我必须重新安装所有东西?

当 namenode 关闭时,辅助 namenode 将不会担任 namenode 的角色。辅助名称节点用于执行检查点。有关详细信息,请参阅 https://hadoop.apache.org/docs/r2.4.1/hadoop-project-dist/hadoop-hdfs/HdfsUserGuide.html#Secondary_NameNode for details . To have high availability of namenode you need to implement HA. Refer to apache website