Amazon Redshift:查找并修复倾斜的 DISTKEY

Amazon Redshift: Finding and fixing a skewed DISTKEY

从我的 Redshift 集群性能面板中,我可以看到其中一个节点的数据量大约是其他节点的两倍,这也导致 CPU 利用率显着提高。数据库中有几十个大表使用基于键的分布,我一直没能找到哪些没有适当平衡。

在文档中搜索,我看到 SVV_TABLE_INFO 视图有一个名为 skew_rows 的列。是我要找的号码吗?

我想这篇文章中的“pct_skew_across_slices”就是您要找的。

http://docs.aws.amazon.com/redshift/latest/dg/c_analyzing-table-design.html