如何使用 postgresql 为数据仓库星型模式创建一个简单的日维度 table?

How do I make a simple day dimension table for data warehousing star schema with postgresql?

我将如何为 postgreSQL 中的星型模式创建和填充简单的 DAY 维度 table? 这是一门数据仓库的入门课程,所以它只有几个领域,但大多数在线示例都非常复杂,对于初学者来说似乎非常复杂。这不是作业 - 它是为了学习,因为我正在尝试用事实 table 制作我自己的简单星图,这样我就可以开始使用它 table 了。

任何人都可以给我一个简单的例子,说明我如何创建 table 仅包含几个字段(day_key 作为代理键、描述日期的字符串和一些整数值例如代表几天或几个月)这样我至少可以开始理解?

一个非常简单的 DAY 维度 table 应该适用于大多数版本的 PostgreSQL(我使用的是 10.5)。这只是应该帮助刚接触数据仓库的人创建一个基本的日维度,以便在刚开始时使用。

创造一天Table

CREATE TABLE day (
    day_key SERIAL PRIMARY KEY, -- SERIAL is an integer that will auto-increment as new rows added
    description VARCHAR(40), -- a 'string' for a description
    full_date DATE, -- an actual date type
    month_number INTEGER,
    month_name VARCHAR(40),
    year INTEGER
);

正在将行插入日维度

INSERT INTO day(description, full_date, month_number, month_name, year)
SELECT 
to_char(days.d, 'FMMonth DD, YYYY'), 
days.d::DATE, 
to_char(days.d, 'MM')::integer, 
to_char(days.d, 'FMMonth'), 
to_char(days.d, 'YYYY')::integer 
from (
    SELECT generate_series(
        ('2019-01-01')::date, -- 'start' date
        ('2019-12-31')::date, -- 'end' date
        interval '1 day'  -- one for each day between the start and day
        )) as days(d);

结果

备注:

  • 基本上,您只是使用嵌套 SELECT generate_series(... 生成的行插入 Day table。
  • 我使用上面的 FM 两次来删除一些在这些日期格式中自动生成的白色 space 填充。
  • 我建议您在第一次执行此操作时删除 INSERT INTO day(...) 行,以确保每列的格式在将其插入 table 之前符合您的要求。

这正是我见过的常用方法 - 查看 PostgreSQL 文档有一些更全面和更好的 examples 格式化日期类型和获取各种有用维度的更多方法。