对海量数据进行分区和处理 SSAS 多维数据集

Partition and process SSAS cube for huge data

我有一个具有刚性关系的 SSAS 多维数据集。每天我只从源头获取最近 2 个月的数据。我的多维数据集自 2010 年起就有数据。我打算对该多维数据集进行分区，然后对其进行处理。我的问题是

我知道在严格的关系中我必须处理完整的过程。这是否意味着我必须将所有分区处理为进程已满，或者我可以继续处理选定的分区以处理已满。
如何设计分区策略？如果我做 2 个月的分区，那么我每年将有 6 个分区，之后它们可能会增加。我想到了 6 个月的分区。但如果我在第 7 个月或第 1 个月，那么我必须处理两个分区（即当前 + 最后 6 个月）。够好吗？

在属性关系实际发生变化时将它们标记为刚性关系（这意味着当汇总发生变化时，例如产品 A 汇总到谷物与燕麦片类别）是一个坏主意。只需将它们标记为灵活的关系。刚性与柔性不会影响查询性能，只会影响处理性能。如果 Rigid 导致您对维度执行 ProcessFull，这将意味着您必须重新处理所有度量值组分区。因此，将关系更改为 Flexible，除非您 100% 确定您永远不会运行在您的 ETL 中对您的维度 table 进行 UPDATE 语句。

我会按月划分。然后你可以每天处理最近两个月。更明确地说：

处理更新您的维度
ProcessData 最近两个月的分区。
多维数据集上的 ProcessIndexes（在旧分区上重建索引和灵活聚合）

对海量数据进行分区和处理 SSAS 多维数据集

Partition and process SSAS cube for huge data

ssas

partitioning

olap-cube

sql-server-2012