用于数据仓库的 AWS Redshift 或 RDS?

AWS Redshift or RDS for a Data warehouse?

现在我们有一个 ETL,它从 API 中提取信息,转换并存储在我们的 OLTP 数据库中的一个大 table 中,我们想将这个 table 迁移到一些OLAP 解决方案。此 table 仅用于执行我们存储在 OLTP 数据库中的一些计算。

哪种服务最适合这里?

我们目前正在评估 Redshift,但之前从未使用过该服务。此外,我们在 RDS 中考虑了一些雪花模式(某种事实 table 与维度),因为旨在存储 10GB 到 100GB 但不知道这种方法可以扩展多少。

当您只想从数据库中读取数据时,AWS Redshift 真的很棒。基本上,后端的Redshift是一个面向列的数据库,更适合分析。您可以使用 AWS DMS 将所有现有数据传输到 redshift。 AWS DMS 是一项服务,基本上需要现有数据库的二进制日志,它会自动传输您的数据,我们无需执行任何操作。从我个人的经验来看,Redshift 真的很棒。

Which service fits the most here?

恕我直言,您可以做一个 PoC,看看哪种服务更适合您。这实际上取决于您拥有多少数据、什么查询以及您计划执行什么负载。

AWS Redshift 适用于处理繁重的并行工作负载的 peta 或 exa 字节规模之上的 OLAP。 RS 还可以从其他数据源(jdbc、s3、..)聚合数据。然而 RS 不是 OLTP,它需要更多的静态服务器开销和管理部署的额外技能。

因此,如果没有更多的数字和用例,就无法提供任何建议。 Cloud很棒,你可以试试看适合你的。