验证cassandra中数据中心之间的数据一致性

Verifying data consistency between data centers in cassandra

我维护着一个带有 2 个数据中心的 cassandra 集群。现在我要在现有集群中添加新的数据中心。重建数据后,如何验证新数据中心数据的一致性?

从每个 DC 中读取 LOCAL_QUORUM 并进行最直接的比较。

修复从压缩任务中的 sstables 构建分区哈希并比较它们的范围,这比单独读取数据更有效。您可以将该部分从代码中提取出来,以构建一个工具来做同样的事情……或者如果您可以 运行 进行(完全而非增量)修复。它记录它发现的差异。