如何处理具有 75M 个位置的地址维度

how to handle address dimension with 75M locations

我正在为 Snowflake 模式数据仓库创建地址维度。我想将源上的 75M 个位置转换为所述模式。我知道如何处理 Zip->City->County->State 维度,但是如果我将街道地址添加到位置维度,我将拥有与事实行数量相等的维度行。

我需要知道的是,街道地址应该去哪里(123 anywhere St.)?它应该放在事实 table 中吗?我如何处理街道地址?

谢谢。

街道地址本身应该放在事实中。如果它是一个房地产应用程序,我想会有某种 "Sale Contract Fact" 或 "Rental Contract Fact" 或类似的东西 - 街道地址将是该事实的一个属性。

在您的实例中,地址实例肯定与单个交易相关联。正如您所说,同一个街道地址可能会出现多次,但它会出现在不同的销售合同中,因此会出现不同的事实实例。

地址的其他元素(邮政编码、城市、州等)将被维度化,因为将它们分组以进行分类是有意义的。