为什么数据仓库时间依赖?
why is data warehouse time dependent?
我的教科书上说数据仓库中的数据只在一段时间内有效,换句话说,它被认为是时间相关的,但根据数据仓库的四个特性,非易失性属性 表示数据一旦输入到数据仓库中,就不能再更改。
那么还有其他属性数据仓库讨论数据仓库是时间相关的吗?
你的教科书是说 "time dependent" 还是 "time variant"?这可能是对 Bill Inmon 的定义的解释,即数据仓库是面向主题的、集成的、时变的和非易失性的。
"Time variant"表示数据仓库完全包含在一个时间段内。另一种说法是,DW 在一个时期内是一致的,这意味着数据仓库每天、每小时或以其他周期为基础加载,并且在该时期内不会发生变化。
请记住,这些要求是在 1992 年编写的,大约 25 年后,当实时数据仓库成为现实并且数据仓库可能每秒更改几次时,它们有点难以支持。
另外,请注意"non-volatile."的定义 有人将其解释为数据永远不会改变,但这又是一个过时的概念。显示订单预测发货日期的累积快照事实 table 可能会在订单生命周期内多次更新。当然,这取决于事实的目的——如果是衡量预测日期的波动性,我们会保留所有更改,但如果是衡量订单在其生命周期中的流动,我们只会更新它.
就我个人而言,我更喜欢 Ralph Kimball 的定义,"A data warehouse is a copy of transaction data specifically structured for query and analysis." 更清楚、更切题。
我的教科书上说数据仓库中的数据只在一段时间内有效,换句话说,它被认为是时间相关的,但根据数据仓库的四个特性,非易失性属性 表示数据一旦输入到数据仓库中,就不能再更改。
那么还有其他属性数据仓库讨论数据仓库是时间相关的吗?
你的教科书是说 "time dependent" 还是 "time variant"?这可能是对 Bill Inmon 的定义的解释,即数据仓库是面向主题的、集成的、时变的和非易失性的。
"Time variant"表示数据仓库完全包含在一个时间段内。另一种说法是,DW 在一个时期内是一致的,这意味着数据仓库每天、每小时或以其他周期为基础加载,并且在该时期内不会发生变化。
请记住,这些要求是在 1992 年编写的,大约 25 年后,当实时数据仓库成为现实并且数据仓库可能每秒更改几次时,它们有点难以支持。
另外,请注意"non-volatile."的定义 有人将其解释为数据永远不会改变,但这又是一个过时的概念。显示订单预测发货日期的累积快照事实 table 可能会在订单生命周期内多次更新。当然,这取决于事实的目的——如果是衡量预测日期的波动性,我们会保留所有更改,但如果是衡量订单在其生命周期中的流动,我们只会更新它.
就我个人而言,我更喜欢 Ralph Kimball 的定义,"A data warehouse is a copy of transaction data specifically structured for query and analysis." 更清楚、更切题。