cassandra:调度节点工具修复最佳实践

cassandra: scheduling nodetool repair best practice

我有几个关于 nodetool 修复及其调度的问题。

假设:

Q1。确定执行修复的组的最佳做法是什么。 (a)每个节点或(b)每个table或(c)两者?

示例:

Q2。安排维修任务的最佳实践 我认为有两个样本(基于日历)。有什么建议或更好的时间表吗?

day M T W Th F St S

W1 I1 I2 I3 I4 I1 I2 F1

W2 I3 I4 I1 I2 I3 I4 F2

W3 I1 I2 I3 I4 I1 I2 F3

W4 I3 I4 I1 I2 I3 I4 F4

day M T W Th F St S

W1 I1 I2 I3 I1 I2 I3 F1

W2 I1 I2 I3 I1 I2 I3 F2

W3 I1 I2 I3 I1 I2 I3 F3

W4 I1 I2 I3 I1 I2 I3备用

为清楚起见进行编辑。

Q1。优先维修:

  • 因未收到提示而停机超过 3 小时的节点 之后交接。
  • 您通过以下方式看到丢失突变的节点 nodetool tpstats
  • 您 运行 作为您的一部分删除的表 业务逻辑,以确保所有节点都获得墓碑。

Q2。这取决于您的集群大小和负载。如果您的集群可以在 10 天内修复并完全修复,请坚持使用。增量修复具有拆分 sstables 的不便。这将在以后增加额外的压缩负载。