一个集群节点擅离职守后的 Ambari 恢复

Ambari recovery after one cluster node goes AWOL

我在一个有四个节点的 AWS 集群上安装了 Ambari 和 HDP。我的一个节点死了,无法再访问(无法与它交谈,它也不会与其他任何人交谈)。我对数据丢失没问题,但不知道如何告诉 Ambari 放开那个特定的主机。我该怎么办?

如果您在此主机上没有任何大师,您可能想要关注this manual

我希望 HDFS 支持删除无法访问的数据节点。

但是如果您在这台主机上有 master,那就是大麻烦了,我预计 Ambari 不支持删除死机(无需手动编辑数据库)

您可能还想在 https://community.hortonworks.com/ 上提问,也许有人会建议解决方法(某种肮脏的 hack)