关于启动备用 HDFS HA namenode 的 SIGTERM

SIGTERM on starting a standby HDFS HA namenode

我有一个未启用 HA 的 HDFS 集群,我想将其重新配置为 HA。我遵循了这些步骤:

  1. 关闭唯一的名称节点(N1)和所有数据节点。
  2. 使用新的 HA 配置更新所有节点。
  3. 启动日志节点。
  4. 创建第二个名称节点(N2)。
  5. 运行 hdfs namenode -bootstrapStandby 在新的名称节点 N2 上。请注意,我必须首先启动旧的名称节点 N1 才能使其正常工作。
  6. 运行 hdfs namenode -initializeSharedEdits 在主名称节点 N1 上。

毕竟我尝试启动新的名称节点 N2。它导致了以下错误:

ERROR org.apache.hadoop.hdfs.server.namenode.NameNode: RECEIVED SIGNAL 15: SIGTERM

知道如何解决这个问题吗?

问题是集群配置了 Zookeeper 的自动故障转移,但 Zookeeper 节点没有设置。设置 Zookeeper 集群后问题消失。