关于启动备用 HDFS HA namenode 的 SIGTERM
SIGTERM on starting a standby HDFS HA namenode
我有一个未启用 HA 的 HDFS 集群,我想将其重新配置为 HA。我遵循了这些步骤:
- 关闭唯一的名称节点(N1)和所有数据节点。
- 使用新的 HA 配置更新所有节点。
- 启动日志节点。
- 创建第二个名称节点(N2)。
- 运行
hdfs namenode -bootstrapStandby
在新的名称节点 N2 上。请注意,我必须首先启动旧的名称节点 N1 才能使其正常工作。
- 运行
hdfs namenode -initializeSharedEdits
在主名称节点 N1 上。
毕竟我尝试启动新的名称节点 N2。它导致了以下错误:
ERROR org.apache.hadoop.hdfs.server.namenode.NameNode: RECEIVED SIGNAL 15: SIGTERM
知道如何解决这个问题吗?
问题是集群配置了 Zookeeper 的自动故障转移,但 Zookeeper 节点没有设置。设置 Zookeeper 集群后问题消失。
我有一个未启用 HA 的 HDFS 集群,我想将其重新配置为 HA。我遵循了这些步骤:
- 关闭唯一的名称节点(N1)和所有数据节点。
- 使用新的 HA 配置更新所有节点。
- 启动日志节点。
- 创建第二个名称节点(N2)。
- 运行
hdfs namenode -bootstrapStandby
在新的名称节点 N2 上。请注意,我必须首先启动旧的名称节点 N1 才能使其正常工作。 - 运行
hdfs namenode -initializeSharedEdits
在主名称节点 N1 上。
毕竟我尝试启动新的名称节点 N2。它导致了以下错误:
ERROR org.apache.hadoop.hdfs.server.namenode.NameNode: RECEIVED SIGNAL 15: SIGTERM
知道如何解决这个问题吗?
问题是集群配置了 Zookeeper 的自动故障转移,但 Zookeeper 节点没有设置。设置 Zookeeper 集群后问题消失。