在 Redshift 中使用排序键和压缩进行暂存 table

Using sortkeys and compression for a staging table with Redshift

如果目标 tables 已经有了，那么在 Redshift 中每天截断的 staging tables 添加排序键和压缩是否有意义？当您在插入目标时执行转换时，它有什么不同吗？table?

我担心的是它是否会以任何方式帮助或损害性能。

是的，确实如此。当您从暂存 tables 读取数据以将其插入实际 tables 时，排序键将帮助您。（您可能会在 staging 和 real table 之间进行某种连接以确定增量，对吧？）。确保排序键相似，这会有所帮助。

正如您想象的那样，压缩有利有弊。我会在有和没有它的情况下测试相同的过程以得出实际结论 - 但绝对是排序键（和分发键 - 如果适用）。

顺便说一句，行数在这里也有影响——如果你只有几百行，当然可能没有任何区别。