如何在 Hive 中创建 Fact table 并将 table 中的原始值替换为键(id)值
How to create Fact table in Hive and replace original values in table with key (id) values
我想创建的内容在下面进行了说明。在 Hive 中可以这样做吗?
我可以在 Python 中使用 Pandas 并替换列,但我想知道可以在 Hive 中使用查询来完成吗?
我已经在 Hive 中上传了 Source table 并像下面一样创建了 Dimensional tables(在 Cloudera HUE 中),所以是否可以通过使用以某种方式创建 Fact table维度 tables id 值并替换 Source table?
中的值
我有我的来源table:
我从源table创建维度table:
我想像这样创建事实 table:
按值加入源 table 和 select ID:
insert overwrite table fact
select pr.id as property, t.id as type, pl.id as place, s.price
from source_table s
left join property_dim pr on s.property=pr.property
left join type_dim t on s.type=t.type
left join place_dim pl on s.place=pl.place
我想创建的内容在下面进行了说明。在 Hive 中可以这样做吗?
我可以在 Python 中使用 Pandas 并替换列,但我想知道可以在 Hive 中使用查询来完成吗?
我已经在 Hive 中上传了 Source table 并像下面一样创建了 Dimensional tables(在 Cloudera HUE 中),所以是否可以通过使用以某种方式创建 Fact table维度 tables id 值并替换 Source table?
中的值我有我的来源table:
我从源table创建维度table:
我想像这样创建事实 table:
按值加入源 table 和 select ID:
insert overwrite table fact
select pr.id as property, t.id as type, pl.id as place, s.price
from source_table s
left join property_dim pr on s.property=pr.property
left join type_dim t on s.type=t.type
left join place_dim pl on s.place=pl.place