Cassandra 'nodetool repair -pr' 花了太多时间
Cassandra 'nodetool repair -pr' taking way too much time
我正在 运行建立一个集群,每个集群上都安装了 1 个数据中心(10 个节点) 和 Cassandra 2.1.7 .我们正在使用 SimpleStretegy(老错误)。
情况是,我从开始就没有运行任何nodetool修复,现在有大约200GB的数据,3个RF。
与运行宁全修复或增量修复在这一点上是一样的。所以我已经尝试运行全面修复。但这导致协调器节点宕机。
所以我最终 运行ning 完整分区范围修复 (nodetool repair -pr) 在每个节点上一次一个。但这花费了太多时间(每个节点超过 15 小时,因此所有节点需要数周)。
我是不是做错了,或者这是应该发生的?或者这是版本问题?
以后如果我运行完成这个再全面修复,这也需要几周时间吗?
由于完全修复主要受数据大小的影响,因此应该花费相同的时间。
我建议转向增量修复,这会节省您的时间和资源。
这是一篇关于如何在 2.1 中执行此操作的文章:
https://docs.datastax.com/en/cassandra/2.1/cassandra/operations/opsRepairNodesMigration.html
如果你的date size太大,可以使用Sub-range repair,它和pr修复类似,但它是在sub range内进行修复。
更多解释:
https://www.pythian.com/blog/effective-anti-entropy-repair-cassandra
我正在 运行建立一个集群,每个集群上都安装了 1 个数据中心(10 个节点) 和 Cassandra 2.1.7 .我们正在使用 SimpleStretegy(老错误)。
情况是,我从开始就没有运行任何nodetool修复,现在有大约200GB的数据,3个RF。
与运行宁全修复或增量修复在这一点上是一样的。所以我已经尝试运行全面修复。但这导致协调器节点宕机。
所以我最终 运行ning 完整分区范围修复 (nodetool repair -pr) 在每个节点上一次一个。但这花费了太多时间(每个节点超过 15 小时,因此所有节点需要数周)。
我是不是做错了,或者这是应该发生的?或者这是版本问题?
以后如果我运行完成这个再全面修复,这也需要几周时间吗?
由于完全修复主要受数据大小的影响,因此应该花费相同的时间。
我建议转向增量修复,这会节省您的时间和资源。
这是一篇关于如何在 2.1 中执行此操作的文章: https://docs.datastax.com/en/cassandra/2.1/cassandra/operations/opsRepairNodesMigration.html
如果你的date size太大,可以使用Sub-range repair,它和pr修复类似,但它是在sub range内进行修复。
更多解释: https://www.pythian.com/blog/effective-anti-entropy-repair-cassandra