360° 客户数据视图
360° Customer Data View
我正在努力实现 360° 客户数据视图,我想汇集来自整个企业多个系统的数据。我认为这是一个广泛的问题,但通过创建数据仓库是实现这一目标的唯一方法吗?
谢谢
答案是:视情况而定。
绝对最低要求是您能够 link 来自不同源系统的客户。
理论上,您可以创建一个桥接 table,以来自各种源系统的自然键(唯一 ID)作为列,使用某种匹配算法填充它,让报告平台处理加入数据。
实际上,当您尝试这个时,您将 运行 进入一个除了最简单的系统之外的所有系统的痛苦世界:
- 无尽的数据不匹配破坏了人们对准确性的信心,因为源系统之间没有共同的定义。
- 报表生成性能无法接受table 有很多很多联接
- 生产系统可能会受到报告查询的影响
- 对源系统的更改以意想不到的方式中断报告
建立数据集市或数据仓库旨在解决所有这些问题。您一次性提取生产数据,而不是针对每个报告,清理和验证内容,将其转换为 reporting-optimized 形式并以一致的方式呈现给最终用户。
如果您的 360° 视图专注于明确定义的 transactions/interactions,特别是如果它们相互关联(即与最近购买的产品相关的支持票),那么请花时间分析所有传入数据并统一不同来源的相似数据的含义可能是唯一明智的选择。在数据仓库设计的 ETL 层中编写所有这些规则比将逻辑分别嵌入到每个报告中更高效且更易于维护。
如果你有一群数据科学家 运行 进行他们自己的分析,而不需要每次都看到与最后一位数字匹配的数字,你可能会摆脱倾销 semi-structured 来自每个源系统的数据一起存储到 NoSQL DB 或类似的存储中,只有客户唯一 ID 才能将它们联合起来。
我正在努力实现 360° 客户数据视图,我想汇集来自整个企业多个系统的数据。我认为这是一个广泛的问题,但通过创建数据仓库是实现这一目标的唯一方法吗?
谢谢
答案是:视情况而定。
绝对最低要求是您能够 link 来自不同源系统的客户。
理论上,您可以创建一个桥接 table,以来自各种源系统的自然键(唯一 ID)作为列,使用某种匹配算法填充它,让报告平台处理加入数据。
实际上,当您尝试这个时,您将 运行 进入一个除了最简单的系统之外的所有系统的痛苦世界:
- 无尽的数据不匹配破坏了人们对准确性的信心,因为源系统之间没有共同的定义。
- 报表生成性能无法接受table 有很多很多联接
- 生产系统可能会受到报告查询的影响
- 对源系统的更改以意想不到的方式中断报告
建立数据集市或数据仓库旨在解决所有这些问题。您一次性提取生产数据,而不是针对每个报告,清理和验证内容,将其转换为 reporting-optimized 形式并以一致的方式呈现给最终用户。
如果您的 360° 视图专注于明确定义的 transactions/interactions,特别是如果它们相互关联(即与最近购买的产品相关的支持票),那么请花时间分析所有传入数据并统一不同来源的相似数据的含义可能是唯一明智的选择。在数据仓库设计的 ETL 层中编写所有这些规则比将逻辑分别嵌入到每个报告中更高效且更易于维护。
如果你有一群数据科学家 运行 进行他们自己的分析,而不需要每次都看到与最后一位数字匹配的数字,你可能会摆脱倾销 semi-structured 来自每个源系统的数据一起存储到 NoSQL DB 或类似的存储中,只有客户唯一 ID 才能将它们联合起来。