需要将大型表从 RDS 迁移到 DynamoDB 的策略建议

Need strategy advice for migrating large tables from RDS to DynamoDB

我们在 RDS 中有几个 mySql table 非常大(超过 700 GB),我们想迁移到 DynamoDB table。您能否建议一种策略或方向,以干净、并行的方式执行此操作?也许使用 EMR 或 AWS Data Pipeline。

您可以使用 AWS Pipeline。有两种基本模板,一种用于将 RDS 表移动到 S3,另一种用于将数据从 S3 导入 DynamoDB。您可以使用这两个模板创建自己的管道。

此致

对于如此大的数据,需要考虑的一件事是 Dynamo 是否是最佳选择。

如果这是统计数据或其他 "big data",请查看 AWS RedShift,它可能更适合您的情况。

我们做过类似的工作,可能有更好的策略来做这件事。在您的源实例中使用 AWS DMS 和一些准备表。

它涉及两个步骤:

  1. 您在源实例中创建与 dynamodb 模式完全匹配的新表。比如将多个表合并为一个等

  2. 设置 DMS 任务,将准备表作为源,将 DynamoDB 作为目标。由于准备表和目标模式现在匹配,从这一点来看应该非常简单。

希望对您有所帮助!祝你好运!!