为什么在我的案例中 rds 的执行速度比 redshift 快？

Question

我有一个 RDS 实例：db.t2.xlarge（4 个 vCPU，16 GiB 内存）（max_parallel_workers_per_gather=2）

还有另一个 Redshift 实例：dc2.large（2 个 vCPU，15 GiB 内存）（2 个节点）

我已经加载了相同的数据。我尝试了不同类型的查询，但我的 RDS 总是在更短的时间内运行查询。

示例：

我正在尝试的查询如下：

SELECT
  product_id,
  COUNT(*)
FROM az_product_questions
GROUP BY product_id
ORDER BY product_id ASC;

即将上演：

我是否在错误的用例中或以错误的方式尝试将 Redshift 用于较小的数据库？还是正常？

Answer 1

一个普通的数据库在 table 中有 百万行 时开始变慢。 Amazon Redshift 可以处理 table 秒 十亿行 。

对于这个特定的用例，普通的数据库就可以正常工作。但是，当您添加更多行和更多列时，像 Amazon Redshift 这样的列式数据库会显示出更好的性能。

因此，请坚持使用对您而言性能良好的数据库，然后如果您有更高的分析需求，请考虑使用 Redshift。请注意，Redshift 非常适合报告，但不应与执行大量插入和更新的应用程序一起使用。

Why is rds performing faster than redshift in my case?