当 table 跨集群中的多个节点复制时,COPY 如何在 cassandra 中工作?

How COPY works in cassandra when table is replicated accross multplie nodes in a cluster?

假设如果要将 table 从 RF = '3' 的 7 个节点集群复制到另一个 RF '3' 的 6 个节点集群,我该怎么做?我可以将数据从任何节点复制到 CSV 文件,然后将该数据从 CSV 文件导入到新集群中的任何节点吗?或者应该将数据从集群中的每个节点复制到新集群??

我是否应该将复制减少到 1,然后复制数据并将复制更改为 3,但我认为这在生产中不起作用??我该如何解决这个问题??

它不是你必须在每个节点上 运行 的东西。您可以在集群外部的系统上使用 cqlsh 的 COPY 命令。从 sstables/commitlogs 恢复集群是您需要担心的地方(sstableloader 也解决了这个问题)。

它会在使用 COPY TO 时读取所有数据,而在使用 COPY FROM 时它会通过根据您的 RF 分配的写入路径发送每一行。它比使用基本 read/write 脚本更有效地完成,但最终仍然是它所做的。

如果您可以访问 Spark,请查看我的 post(如果您有大量数据,这是进行迁移的最佳方式)。如果您没有大量数据,他们的复制命令将起作用。

www.sestevez.com/cluster-migration-keeping-simple-things-simple/

wget https://github.com/phact/dse-cluster-migration/releases/download/v0.01/dse-cluster-migration_2.10-0.1.jar

dse spark-submit --class phact.MigrateTable --conf spark.dse.cluster.migration.fromClusterHost='<from host>' --conf spark.dse.cluster.migration.toClusterHost='<to host>' --conf spark.dse.cluster.migration.keyspace='<keyspace>' --conf spark.dse.cluster.migration.table='<table>' ./dse-cluster-migration_2.10-0.1.jar