cassandra:调度节点工具修复最佳实践
cassandra: scheduling nodetool repair best practice
我有几个关于 nodetool 修复及其调度的问题。
假设:
- 使用分区程序范围选项 (-pr)
- 使用并行修复
- GCgracesecodns 是默认值(10 天)
Q1。确定执行修复的组的最佳做法是什么。
(a)每个节点或(b)每个table或(c)两者?
示例:
- (a) 节点 0-2 => Group-1,Node3-5 => Group-2 ... 等等
- (b) Table 用户 => 组 1,table 视频 => 组 2 ...等
- (c) a 和 b 的混合
Q2。安排维修任务的最佳实践
我认为有两个样本(基于日历)。有什么建议或更好的时间表吗?
- IN ...增量组-N
- FN ... 全组-N
- WN ...周(1 到 4)
- M - S ...周一周二...周日
day M T W Th F St S
W1 I1 I2 I3 I4 I1 I2 F1
W2 I3 I4 I1 I2 I3 I4 F2
W3 I1 I2 I3 I4 I1 I2 F3
W4 I3 I4 I1 I2 I3 I4 F4
day M T W Th F St S
W1 I1 I2 I3 I1 I2 I3 F1
W2 I1 I2 I3 I1 I2 I3 F2
W3 I1 I2 I3 I1 I2 I3 F3
W4 I1 I2 I3 I1 I2 I3备用
为清楚起见进行编辑。
Q1。优先维修:
- 因未收到提示而停机超过 3 小时的节点
之后交接。
- 您通过以下方式看到丢失突变的节点
nodetool tpstats
- 您 运行 作为您的一部分删除的表
业务逻辑,以确保所有节点都获得墓碑。
Q2。这取决于您的集群大小和负载。如果您的集群可以在 10 天内修复并完全修复,请坚持使用。增量修复具有拆分 sstables 的不便。这将在以后增加额外的压缩负载。
我有几个关于 nodetool 修复及其调度的问题。
假设:
- 使用分区程序范围选项 (-pr)
- 使用并行修复
- GCgracesecodns 是默认值(10 天)
Q1。确定执行修复的组的最佳做法是什么。 (a)每个节点或(b)每个table或(c)两者?
示例:
- (a) 节点 0-2 => Group-1,Node3-5 => Group-2 ... 等等
- (b) Table 用户 => 组 1,table 视频 => 组 2 ...等
- (c) a 和 b 的混合
Q2。安排维修任务的最佳实践 我认为有两个样本(基于日历)。有什么建议或更好的时间表吗?
- IN ...增量组-N
- FN ... 全组-N
- WN ...周(1 到 4)
- M - S ...周一周二...周日
day M T W Th F St S
W1 I1 I2 I3 I4 I1 I2 F1
W2 I3 I4 I1 I2 I3 I4 F2
W3 I1 I2 I3 I4 I1 I2 F3
W4 I3 I4 I1 I2 I3 I4 F4
day M T W Th F St S
W1 I1 I2 I3 I1 I2 I3 F1
W2 I1 I2 I3 I1 I2 I3 F2
W3 I1 I2 I3 I1 I2 I3 F3
W4 I1 I2 I3 I1 I2 I3备用
为清楚起见进行编辑。
Q1。优先维修:
- 因未收到提示而停机超过 3 小时的节点 之后交接。
- 您通过以下方式看到丢失突变的节点
nodetool tpstats
- 您 运行 作为您的一部分删除的表 业务逻辑,以确保所有节点都获得墓碑。
Q2。这取决于您的集群大小和负载。如果您的集群可以在 10 天内修复并完全修复,请坚持使用。增量修复具有拆分 sstables 的不便。这将在以后增加额外的压缩负载。