Cassandra 中具有内部节点数的集群
Clusters with innegal number of nodes in Cassandra
架构:
我有两个 DC:
DC1 有 3 个服务器,每个服务器有 1 Tera 作为存储。
我们有 NetworkToplogyStrategy 和 GossipingPropertyFileSnitch
假设我有一个 1T 的传入数据(在一段时间内,而不是一次全部),复制为 3。这应该可以填满我在 DC1 的 3 个服务器中的存储。
我的问题:
是否可以(推荐或不推荐)在另一个 DC2(复制因子也为 3)中部署 6 台具有 0.5 T 存储空间的机器 space 以维持 1T 流量? (我也可能在 DC2 中有更多本地连接)
注意:我问你这个问题,因为将来不同的数据中心可能具有不同的基础设施和硬件功能,所以我需要知道在我的问题中 DC1 和 DC2 是否可以使用该硬件模式。
提前致谢。
看来你的问题确实是 "Can I have datacenters with different topologies?",答案是肯定的 - 你可以很容易地拥有一个 RF=N=3 的 DC,以及第二个 DC 的节点大小的一半和RF=3,N=6,另一个数据中心有微型节点,RF=3,N=12。
Is it possible ( recommended or not ) in the other DC2 ( with replication factor of 3 also ) to deploy 6 machines with 0.5 T as storage space to be able to sustain the 1T flow?
理论上是可以的。
现在在实践中,根据数据真正平衡的方式,有时您无法在每个节点上完美分配 1/6 的数据,因此您可能会遇到磁盘问题 space。如果在虚拟节点上非常正确,尽管在 Cassandra 中更好 3.x 因为代币分配算法已得到改进。
此外,如果您正在使用 SizeTieredCompactionStrategy,您应该保留一些空闲磁盘 space 用于压缩。
架构:
我有两个 DC:
DC1 有 3 个服务器,每个服务器有 1 Tera 作为存储。 我们有 NetworkToplogyStrategy 和 GossipingPropertyFileSnitch
假设我有一个 1T 的传入数据(在一段时间内,而不是一次全部),复制为 3。这应该可以填满我在 DC1 的 3 个服务器中的存储。
我的问题:
是否可以(推荐或不推荐)在另一个 DC2(复制因子也为 3)中部署 6 台具有 0.5 T 存储空间的机器 space 以维持 1T 流量? (我也可能在 DC2 中有更多本地连接)
注意:我问你这个问题,因为将来不同的数据中心可能具有不同的基础设施和硬件功能,所以我需要知道在我的问题中 DC1 和 DC2 是否可以使用该硬件模式。
提前致谢。
看来你的问题确实是 "Can I have datacenters with different topologies?",答案是肯定的 - 你可以很容易地拥有一个 RF=N=3 的 DC,以及第二个 DC 的节点大小的一半和RF=3,N=6,另一个数据中心有微型节点,RF=3,N=12。
Is it possible ( recommended or not ) in the other DC2 ( with replication factor of 3 also ) to deploy 6 machines with 0.5 T as storage space to be able to sustain the 1T flow?
理论上是可以的。
现在在实践中,根据数据真正平衡的方式,有时您无法在每个节点上完美分配 1/6 的数据,因此您可能会遇到磁盘问题 space。如果在虚拟节点上非常正确,尽管在 Cassandra 中更好 3.x 因为代币分配算法已得到改进。
此外,如果您正在使用 SizeTieredCompactionStrategy,您应该保留一些空闲磁盘 space 用于压缩。