为时间点恢复重启集群的正确顺序是什么?

What is the Correct order to restart a cluster for point-in-time restore?

我有一个跨多个数据中心的混合工作负载集群。我有 运行 sstableloader 命令用于要使用我备份的快照恢复的表。我已经添加了我从存档备份到所有节点上的还原目录的提交日志文件。我已经用这些配置更新了 commitlog_archiving.properties 文件。 重启集群节点的正确方法和顺序是什么? these considerations也申请重启吗?

如果你已经完成了所有这些,我认为顺序并不重要。虽然,您应该先 重新启动种子节点,这样集群中的节点就有一个共同的集群入口点来找到它们返回并正确重新加入的方式。

作为一般规则,我们建议在其他节点之前首先重启 DC 中的种子节点,以便八卦传播发生得更快,特别是对于较大的集群(任意超过 15 个节点)。请务必注意,如果您使用 sstableloader.

恢复数据,不需要重新启动

如果您只是执行滚动重启,那么 DC 的顺序并不重要。但是,如果您从 冷关机 启动集群,这很重要,这意味着所有节点都已关闭并且集群完全离线。

从冷关机开始时,重要的是从“分析 DC”开始(Analytics 模式下的节点 运行,即启用 Spark),因为它更容易选择火花大师。假设 Analytics 键空间的复制配置了推荐的复制因子 3,您将需要从种子开始启动 2 或 3 个节点,理想情况下相隔 1 分钟,因为 LeaderManager 需要节点的法定人数来选择 Spark大师.

为了方便起见,我们建议最后让节点 运行 处于 Search 模式(启用 Solr)的 DC,以便所有其他 DC 在集群开始接受来自的搜索请求之前运行应用程序。干杯!