按 Sortkey 顺序和 VACUUM 加载数据
Loading Data in Sortkey Order and VACUUM
我正在将 table 的夜间快照加载到 Redshift 中。
我在 table 的末尾添加了一个名为 "rundate" 的列,它仅代表何时通过我的 ETL 过程提取数据。它也是主要排序键。
每天晚上的 table 时间越来越长,其中许多栏目有 400 多栏。
现在我将 FILLRECORD 与 EMPTYASNULL 结合使用,以便将 NULLS 放入 table,一旦 COPY 命令完成,我将使用
update table set rundate = 'date' where rundate is NULL
为了获得正确的快照日期。
我想知道它是否仍被视为 "loading the data in sortkey order",我不需要吸尘。除此之外,没有对任何记录进行 updates/deletes。
很遗憾没有。更新将执行 delete/insert 每天将您的整个负载作为需要 VACUUM 的死记录。我建议改为加载到一个空阶段 table,然后在分阶段后插入带有额外 rundate 列的数据。
我正在将 table 的夜间快照加载到 Redshift 中。 我在 table 的末尾添加了一个名为 "rundate" 的列,它仅代表何时通过我的 ETL 过程提取数据。它也是主要排序键。
每天晚上的 table 时间越来越长,其中许多栏目有 400 多栏。
现在我将 FILLRECORD 与 EMPTYASNULL 结合使用,以便将 NULLS 放入 table,一旦 COPY 命令完成,我将使用
update table set rundate = 'date' where rundate is NULL
为了获得正确的快照日期。
我想知道它是否仍被视为 "loading the data in sortkey order",我不需要吸尘。除此之外,没有对任何记录进行 updates/deletes。
很遗憾没有。更新将执行 delete/insert 每天将您的整个负载作为需要 VACUUM 的死记录。我建议改为加载到一个空阶段 table,然后在分阶段后插入带有额外 rundate 列的数据。