Couchbase 3.1:机架感知、副本和自动故障转移行为

Couchbase 3.1: Rack Awareness , Replica and autoFailover behaviors

我对 Couchbase(3.1) 的 RAZ +Replica+ autoFailover 行为有疑问。

我想模拟以下配置和灾难场景:

2个节点在VMWare VCenter提供的vm平台上(模拟couchbase集群的第一部分成员来自主生产区)。和 3个节点在RHEV提供的vm平台上(基于KVM)(模拟couchbase集群的第二部分成员来自同一数据中心的次级产品区)

所有这 5 个节点都安装了相同的 OS 和相同版本的 couchbase(3.1) 位。 并配置为一个集群,在第一轮测试中创建了一个存储桶并且 replica=2,后来为该存储桶更改为 3。 "Auto Failover" 设置已启用。

假设二级生产区(RHEV平台提供)的三个节点同时挂掉(模拟二级生产区完全挂掉,比如整个RHEV平台断电挂掉)。

最大程度地减少对集群可用性的损害并减少 connecting/operating couchbase 集群对应用程序的影响的最佳方法是什么。(r/w 操作)。

对于这个 3 节点崩溃的场景,充分利用机架感知、微调副本数量和正确操作步骤的最佳组合是什么?

顺便说一句:假设在执行故障转移(或自动故障转移)时没有 capacity/load 问题,也就是级联故障。

谢谢

如果您要将 RZA 与您所谈论的两个管理程序一起使用,我会以均匀的数量进行。每个 HV 上有 3 个节点,HV #1 上的所有节点都在服务器组 #1 中,HV #2 上的所有节点都在服务器组 #2 中。不过,您只需要 1 个副本。对于您在整个 HV 出现故障时提到的故障场景,拥有多个副本根本无济于事。当 运行 RZA 就像我提到的那样,SG#1 中节点的所有副本都在 SG#2 中的节点上结束,反之亦然。希望这是有道理的。

此外,我们正在讨论的配置中的 RZA 是生产中的企业专用功能,因此这意味着您已经为此付费(生产中超过 2 个节点的任何东西都必须获得许可)。我只提到这一点,因为可以将此类事情提交给您的 Couchbase 客户经理或技术支持团队,以获得此帮助和其他更详细的帮助。