sstableloader 在 ScyllaDB 中插入的行更少
Less rows being inserted by sstableloader in ScyllaDB
我正在尝试使用 sstableloader 将数据从快照从 Cassandra 迁移到 ScyllaDB,并且某些表中的数据加载时没有任何错误,但是当使用 PySpark 验证计数时,它在 ScyllaDB 中提供的行数少于在 Cassandra 中提供的行数。需要帮助!
我在 ScyllaDB 工作
有两个工具可以用来帮助找出差异:
https://github.com/scylladb/scylla-migrate (https://github.com/scylladb/scylla-migrate/blob/master/docs/scylla-migrate-user-guide.md) 您可以使用 check
模式来查找缺失的行。
https://github.com/scylladb/scylla-migrator is a tool for migration from alive CQL clusters one to another (Cassandra --> Scylla) will work that also supports validation (https://github.com/scylladb/scylla-migrator#running-the-validator). There is a blog series on using this tool https://www.scylladb.com/2019/02/07/moving-from-cassandra-to-scylla-via-apache-spark-scylla-migrator/.
如果确实缺少行,请 post https://github.com/scylladb/scylla/issues 上的错误。
通过在 Cassandra 键空间上使用 nodetool repair 解决了这个问题,拍摄快照并使用 sstableloader 将快照加载到 ScyllaDB 中。
我正在尝试使用 sstableloader 将数据从快照从 Cassandra 迁移到 ScyllaDB,并且某些表中的数据加载时没有任何错误,但是当使用 PySpark 验证计数时,它在 ScyllaDB 中提供的行数少于在 Cassandra 中提供的行数。需要帮助!
我在 ScyllaDB 工作
有两个工具可以用来帮助找出差异:
https://github.com/scylladb/scylla-migrate (https://github.com/scylladb/scylla-migrate/blob/master/docs/scylla-migrate-user-guide.md) 您可以使用
check
模式来查找缺失的行。https://github.com/scylladb/scylla-migrator is a tool for migration from alive CQL clusters one to another (Cassandra --> Scylla) will work that also supports validation (https://github.com/scylladb/scylla-migrator#running-the-validator). There is a blog series on using this tool https://www.scylladb.com/2019/02/07/moving-from-cassandra-to-scylla-via-apache-spark-scylla-migrator/.
如果确实缺少行,请 post https://github.com/scylladb/scylla/issues 上的错误。
通过在 Cassandra 键空间上使用 nodetool repair 解决了这个问题,拍摄快照并使用 sstableloader 将快照加载到 ScyllaDB 中。