在 Redshift 中使用排序键和压缩进行暂存 table
Using sortkeys and compression for a staging table with Redshift
如果目标 tables 已经有了,那么在 Redshift 中每天截断的 staging tables 添加排序键和压缩是否有意义?当您在插入目标时执行转换时,它有什么不同吗?table?
我担心的是它是否会以任何方式帮助或损害性能。
是的,确实如此。
当您从暂存 tables 读取数据以将其插入实际 tables 时,排序键将帮助您。 (您可能会在 staging 和 real table 之间进行某种连接以确定增量,对吧?)。
确保排序键相似,这会有所帮助。
正如您想象的那样,压缩有利有弊。我会在有和没有它的情况下测试相同的过程以得出实际结论 - 但绝对是排序键(和分发键 - 如果适用)。
顺便说一句,行数在这里也有影响——如果你只有几百行,当然可能没有任何区别。
如果目标 tables 已经有了,那么在 Redshift 中每天截断的 staging tables 添加排序键和压缩是否有意义?当您在插入目标时执行转换时,它有什么不同吗?table?
我担心的是它是否会以任何方式帮助或损害性能。
是的,确实如此。 当您从暂存 tables 读取数据以将其插入实际 tables 时,排序键将帮助您。 (您可能会在 staging 和 real table 之间进行某种连接以确定增量,对吧?)。 确保排序键相似,这会有所帮助。
正如您想象的那样,压缩有利有弊。我会在有和没有它的情况下测试相同的过程以得出实际结论 - 但绝对是排序键(和分发键 - 如果适用)。
顺便说一句,行数在这里也有影响——如果你只有几百行,当然可能没有任何区别。