Hazelcast 基于 HTTP 的健康检查行为

Hazelcast’s HTTP-based health check behaviour

我们启用了 Hazelcast 的基于 HTTP 的健康检查实现,它提供有关您的集群和成员的基本信息 它启动的节点。

http://<member’s host IP>:5701/hazelcast/health

得到如下输出:

Hazelcast::NodeState=ACTIVE
Hazelcast::ClusterState=ACTIVE
Hazelcast::ClusterSafe=TRUE
Hazelcast::MigrationQueueSize=0
Hazelcast::ClusterSize=5
    
    

我们的集群大小为 5,但有时监控报告大小为 3、4 或 2。

有人可以解释确定 clustersize 的参数意味着 hazelcast 成员故障检测是如何工作的吗?

如果集群大小不稳定,则意味着节点可能正在从集群中删除。这可能是由于网络问题或节点 运行 资源不足造成的。 在此处 Here - Reference Manual

解释了 Hazelcast 故障检测以及如何 select 和微调检测规则