数据仓库中维度的多个来源
Multiple sources for dimensions in Data Warehouse
我目前正在研究金融风险数据仓库。对于我的附带维度,我正在从一个源系统中提取数据。然而,在业务分析师进一步研究之后,我们发现了一个遗留应用程序,该应用程序还包含银行在数据仓库中也需要的抵押信息。除了两个源系统共享的一些共同属性外,遗留应用程序包含的属性比我当前的附属维度中已经定义的属性多得多。因此,在仓库中载入这些新信息的最佳方式是什么?我正在考虑扩展当前的抵押品范围,但每次我找到新的来源时我都需要这样做,考虑到银行的规模,这很可能。或者,创建一个名为 dimCollateralAdditionalInfo 的新维度并在其中添加额外属性是否更好?
正如我们常说的那样,随着时间的推移,新的业务需求可能会出现,因此 DWH 模型会随着时间的推移而演变。最重要的是检查新属性是否值得添加,以及它们是否呈现分析轴。
您可以将所有信息存储在 dimCollateral 中,您需要考虑在优化(索引、数据类型...)方面妥善管理此维度
或者您可以创建包含附加信息的扩展维度 dimCollateralExtension,它将与主维度具有一对一的关系
昏暗的抵押品
我目前正在研究金融风险数据仓库。对于我的附带维度,我正在从一个源系统中提取数据。然而,在业务分析师进一步研究之后,我们发现了一个遗留应用程序,该应用程序还包含银行在数据仓库中也需要的抵押信息。除了两个源系统共享的一些共同属性外,遗留应用程序包含的属性比我当前的附属维度中已经定义的属性多得多。因此,在仓库中载入这些新信息的最佳方式是什么?我正在考虑扩展当前的抵押品范围,但每次我找到新的来源时我都需要这样做,考虑到银行的规模,这很可能。或者,创建一个名为 dimCollateralAdditionalInfo 的新维度并在其中添加额外属性是否更好?
正如我们常说的那样,随着时间的推移,新的业务需求可能会出现,因此 DWH 模型会随着时间的推移而演变。最重要的是检查新属性是否值得添加,以及它们是否呈现分析轴。
您可以将所有信息存储在 dimCollateral 中,您需要考虑在优化(索引、数据类型...)方面妥善管理此维度
或者您可以创建包含附加信息的扩展维度 dimCollateralExtension,它将与主维度具有一对一的关系 昏暗的抵押品