为什么完全复制的Cassandra集群有节点数据大小差异
why full replication Cassandra cluster have node data size difference
我有一个复制因子为 3 的 3 节点 cassandra 集群(版本 3.11.11)。只有 2 个节点正在接收请求,而 Node3 仅与其他 2 个节点同步。
理论上每个节点的数据大小应该是一样的。但实际上,我最终得到的节点具有不同的数据大小,如图所示。
我们每天都有 nodetool repair
,像压缩这样的操作是使用默认设置自动完成的。
尺寸差异的原因可能是什么?
它终于结束了如何在长 运行 中压缩数据。由于压缩是本地过程,因此无法保证如何堆叠 sstables。所以我在这里看不到任何缩写。理论上只是说所有节点在逻辑上都将具有相同的数据,但在物理上可能会有所不同。例如,在 node3 中,您可能有旧的 sstables,由于大小(如果使用 STCS)而没有被压缩,而在其他节点中,它们已经压缩并减小了这些节点的大小。
我有一个复制因子为 3 的 3 节点 cassandra 集群(版本 3.11.11)。只有 2 个节点正在接收请求,而 Node3 仅与其他 2 个节点同步。
理论上每个节点的数据大小应该是一样的。但实际上,我最终得到的节点具有不同的数据大小,如图所示。
我们每天都有 nodetool repair
,像压缩这样的操作是使用默认设置自动完成的。
尺寸差异的原因可能是什么?
它终于结束了如何在长 运行 中压缩数据。由于压缩是本地过程,因此无法保证如何堆叠 sstables。所以我在这里看不到任何缩写。理论上只是说所有节点在逻辑上都将具有相同的数据,但在物理上可能会有所不同。例如,在 node3 中,您可能有旧的 sstables,由于大小(如果使用 STCS)而没有被压缩,而在其他节点中,它们已经压缩并减小了这些节点的大小。