商业智能

Business Intelligence

我需要一些关于 BI 架构的说明。按照我的理解,第一步是从不同的数据源收集数据,清洗,然后通过ETL加载到数据仓库。数据仓库的数据模式不应该是关系型的,应该支持快速业务操作(例如星型模式),最后我们有一些报告工具,如 qlick,Tableau ...等。我的问题是,什么是 OLAP,它是在哪一步出现的?

谢谢,

OLAP = 联机分析处理,通常是指'cube',通常是关于各种汇总的报告

这与 OLTP = 在线事务处理形成对比,后者通常指的是在详细级别进行大量读取和写入的系统(通常存储在关系数据库中)

多维数据集以事实和维度的形式向用户表示事物。

数据仓库星型模式也将事物表示为事实和维度。在数据仓库星型模式中(关系但不是规范化),这些存储在表

要从星型模式中获得 'grand total',您需要编写一个针对数据库运行的 SQL 查询,并将所有详细级别的数据加到总计中。有时这需要时间

要从多维数据集 (OLAP) 中获取 'grand total',您可以拖放所需的维度和度量(您通常使用客户端工具来分析多维数据集),答案出现得更快,因为cube 通常针对摘要进行了优化,(即它通常会预先保存摘要,并且存储机制针对生成摘要进行了优化)

多维数据集通常是从星型模式构建的,但不一定是 - 如果它是星型模式,它只会使构建它变得容易得多

are'nt Olap cubes represented by the data model in warehouse (star schema for ex.)?

是的,他们有代表,但他们是不同的东西。一个将数据存储在数据库中。一个将数据存储在多维数据集中。多维数据集通常是从数据中加载的,通常是从数据库中加载的。