ZK hbase 复制节点呈指数增长,尽管 hbase 数据为对等方正确复制
ZK hbase replication node grows exponentially though hbase datas properly replication for peers
在 hbase-1.4.10 中,我为所有 table 启用了复制并配置了 peer_id。 list_peers 提供以下结果:
hbase(main):001:0> list_peers
PEER_ID CLUSTER_KEY ENDPOINT_CLASSNAME STATE TABLE_CFS BANDWIDTH
1 10.XX.221.XX,10.XX.234.XX,10.XX.212.XX:2171:/hbase nil ENABLED nil 0
1 row(s) in 0.1430 seconds
但是 status_replication 显示复制延迟
hbase(main):002:0> status 'replication'
version 1.4.10
3 live servers
10.XX.232.XX:
SOURCE: PeerID=1, AgeOfLastShippedOp=0, SizeOfLogQueue=1, TimeStampsOfLastShippedOp=Thu Jan 01 05:30:00 IST 1970, Replication Lag=**1619545264329**
SINK : AgeOfLastAppliedOp=0, TimeStampsOfLastAppliedOp=Tue Apr 27 23:09:23 IST 2021
10.XX.118.XX:
SOURCE: PeerID=1, AgeOfLastShippedOp=0, SizeOfLogQueue=1, TimeStampsOfLastShippedOp=Thu Jan 01 05:30:00 IST 1970, Replication Lag=**1619545264663**
SINK : AgeOfLastAppliedOp=0, TimeStampsOfLastAppliedOp=Tue Apr 27 18:53:23 IST 2021
10.XX.138.XX:
SOURCE: PeerID=1, AgeOfLastShippedOp=0, SizeOfLogQueue=1, TimeStampsOfLastShippedOp=Thu Jan 01 05:30:00 IST 1970, Replication Lag=**1619545263509**
SINK : AgeOfLastAppliedOp=0, TimeStampsOfLastAppliedOp=Tue Apr 27 10:31:05 IST 2021
但所有数据都已正确复制到定义的集群。我检查了两个集群中的 table。
我已验证使用 VerifyReplication Mapreduce 检查未复制的行。但是未复制的行中没有行。都是好行。
./hbase org.apache.hadoop.hbase.mapreduce.replication.VerifyReplication 1 tablename
org.apache.hadoop.hbase.mapreduce.replication.VerifyReplication$Verifier$Counters
GOODROWS=45
File Input Format Counters
Bytes Read=0
File Output Format Counters
Bytes Written=0
由于这个问题,我的 Zknodes 在复制下呈指数增长,这导致 运行 ZK 集群出现问题,最终也会影响 Hbase 连接。 ZK
中出现以下异常
ERROR java.io.IOException: Len error
在 ZK 中增加 jute.maxbuffer 不会解决问题,因为复制 znode 正在增加,尽管数据已正确复制到给定集群 Peer_id。
我在集群之间启用了双向复制。它发生在两个集群中。
hbase version - 1.4.10
ZK Version - 3.4.10
Hadoop version - 2.7.3
请帮忙解决这个问题。
以上问题已在以下问题下归档。
https://issues.apache.org/jira/browse/HBASE-22784
升级到 1.4.11 修复了 zknode 呈指数增长的问题
在 hbase-1.4.10 中,我为所有 table 启用了复制并配置了 peer_id。 list_peers 提供以下结果:
hbase(main):001:0> list_peers
PEER_ID CLUSTER_KEY ENDPOINT_CLASSNAME STATE TABLE_CFS BANDWIDTH
1 10.XX.221.XX,10.XX.234.XX,10.XX.212.XX:2171:/hbase nil ENABLED nil 0
1 row(s) in 0.1430 seconds
但是 status_replication 显示复制延迟
hbase(main):002:0> status 'replication'
version 1.4.10
3 live servers
10.XX.232.XX:
SOURCE: PeerID=1, AgeOfLastShippedOp=0, SizeOfLogQueue=1, TimeStampsOfLastShippedOp=Thu Jan 01 05:30:00 IST 1970, Replication Lag=**1619545264329**
SINK : AgeOfLastAppliedOp=0, TimeStampsOfLastAppliedOp=Tue Apr 27 23:09:23 IST 2021
10.XX.118.XX:
SOURCE: PeerID=1, AgeOfLastShippedOp=0, SizeOfLogQueue=1, TimeStampsOfLastShippedOp=Thu Jan 01 05:30:00 IST 1970, Replication Lag=**1619545264663**
SINK : AgeOfLastAppliedOp=0, TimeStampsOfLastAppliedOp=Tue Apr 27 18:53:23 IST 2021
10.XX.138.XX:
SOURCE: PeerID=1, AgeOfLastShippedOp=0, SizeOfLogQueue=1, TimeStampsOfLastShippedOp=Thu Jan 01 05:30:00 IST 1970, Replication Lag=**1619545263509**
SINK : AgeOfLastAppliedOp=0, TimeStampsOfLastAppliedOp=Tue Apr 27 10:31:05 IST 2021
但所有数据都已正确复制到定义的集群。我检查了两个集群中的 table。
我已验证使用 VerifyReplication Mapreduce 检查未复制的行。但是未复制的行中没有行。都是好行。
./hbase org.apache.hadoop.hbase.mapreduce.replication.VerifyReplication 1 tablename
org.apache.hadoop.hbase.mapreduce.replication.VerifyReplication$Verifier$Counters
GOODROWS=45
File Input Format Counters
Bytes Read=0
File Output Format Counters
Bytes Written=0
由于这个问题,我的 Zknodes 在复制下呈指数增长,这导致 运行 ZK 集群出现问题,最终也会影响 Hbase 连接。 ZK
中出现以下异常ERROR java.io.IOException: Len error
在 ZK 中增加 jute.maxbuffer 不会解决问题,因为复制 znode 正在增加,尽管数据已正确复制到给定集群 Peer_id。
我在集群之间启用了双向复制。它发生在两个集群中。
hbase version - 1.4.10
ZK Version - 3.4.10
Hadoop version - 2.7.3
请帮忙解决这个问题。
以上问题已在以下问题下归档。
https://issues.apache.org/jira/browse/HBASE-22784
升级到 1.4.11 修复了 zknode 呈指数增长的问题