为什么完全复制的Cassandra集群有节点数据大小差异

why full replication Cassandra cluster have node data size difference

cassandra

我有一个复制因子为 3 的 3 节点 cassandra 集群（版本 3.11.11）。只有 2 个节点正在接收请求，而 Node3 仅与其他 2 个节点同步。

理论上每个节点的数据大小应该是一样的。但实际上，我最终得到的节点具有不同的数据大小，如图所示。

我们每天都有 nodetool repair，像压缩这样的操作是使用默认设置自动完成的。

尺寸差异的原因可能是什么？

它终于结束了如何在长运行中压缩数据。由于压缩是本地过程，因此无法保证如何堆叠 sstables。所以我在这里看不到任何缩写。理论上只是说所有节点在逻辑上都将具有相同的数据，但在物理上可能会有所不同。例如，在 node3 中，您可能有旧的 sstables，由于大小（如果使用 STCS）而没有被压缩，而在其他节点中，它们已经压缩并减小了这些节点的大小。