一次在多台服务器上进行 Cassandra 清理
Cassandra cleanup on several servers at once
我们有一个很大的 Cassandra 集群,有 18 台服务器(在一台接近 5T 数据的服务器上)
http://docs.datastax.com/en/cassandra/2.0/cassandra/operations/ops_add_node_to_cluster_t.html - 我们在本文档之后添加了一个新节点。
添加新服务器后,我们开始清理数据的过程(nodetool cleanup)
在文档中建议:在所有新节点 运行ning 之后,运行 nodetool 清理每个先前存在的节点以删除不再属于这些节点的密钥。在执行下一个节点之前等待清理在一个节点上完成)
但在我们的案例中,清理一台服务器需要将近 2 - 3 天。
我的问题是我可以同时开始清理多台服务器,2 台或 3 台 ...
否则可能会导致数据丢失?
更多信息。
我们使用带有 vnodes 的 cassandra 2.0.13。此外,我们将文件保存在 cassandra 的 blons 中。
复制因子 = 3
清理不涉及任何其他节点,因此并行 运行 是安全的。但是,您可能希望一次 运行 一次以减少对性能的影响,因为清理可能会使用大量磁盘 I/O。
我们有一个很大的 Cassandra 集群,有 18 台服务器(在一台接近 5T 数据的服务器上)
http://docs.datastax.com/en/cassandra/2.0/cassandra/operations/ops_add_node_to_cluster_t.html - 我们在本文档之后添加了一个新节点。
添加新服务器后,我们开始清理数据的过程(nodetool cleanup)
在文档中建议:在所有新节点 运行ning 之后,运行 nodetool 清理每个先前存在的节点以删除不再属于这些节点的密钥。在执行下一个节点之前等待清理在一个节点上完成)
但在我们的案例中,清理一台服务器需要将近 2 - 3 天。 我的问题是我可以同时开始清理多台服务器,2 台或 3 台 ...
否则可能会导致数据丢失?
更多信息。
我们使用带有 vnodes 的 cassandra 2.0.13。此外,我们将文件保存在 cassandra 的 blons 中。
复制因子 = 3
清理不涉及任何其他节点,因此并行 运行 是安全的。但是,您可能希望一次 运行 一次以减少对性能的影响,因为清理可能会使用大量磁盘 I/O。