【大历史数据的SSAS CUBE分区策略】

[SSAS CUBE Partition Strategy for large historical data]

我有一个大立方体,每天有 250 万个新数据。每周 1900 万。这些数据是历史数据,没有更新,没有删除,也没有change.So这种数据最好的分区策略是什么?你可以看到只有一周有很多数据。每天新建一个分区处理新数据,晚上合并成一个静态大分区好吗?

我认为最好的解决方案是使用不同的范围:

  • (日期)->(分区)
  • 本周 -> 每日(这有助于避免整周都重新处理并且不使用 ProcessAdd 技巧并且仅使用新数据)
  • 今年->每周(53个分区即可)
  • 往年 -> 每年

在每周结束时,您可以合并每日分区。每个分区 1900 万是好的,但是对于更老的年份使用每周可能会导致额外的查询和处理时间。

因此,至少在最近 40 年内(每天 7 个 + 每周 53 个 + 每年 40 个),整个度量值组的分区将少于 100 个。

并且不要忘记将 切片 添加到每个创建的分区。

删除不必要的索引(例如,对于用作属性等的高选择性属性)​​也可能有助于加快处理时间并减少磁盘space使用。