Hive 如何根据条件组合组内的多条记录
Hive how to combine multiple records within a group based on condition
我有如下数据集。
client-Id Name HasCar HasHome
A01 ABC Y N
A01 ABC N N
B01 EFG N N
B01 EFG N Y
从这里我需要为每个客户派生一行,无论他有车还是有房。预期输出应如下所示
Client-Id Name HasCar HasHome
A01 ABC Y N
B01 EFG N Y
这需要使用 Hive-QL 来完成
使用 max() 聚合:
select client-Id,Name, max(HasCar) HasCar, max(HasHome) HasHome
from your_table
group by client-Id,Name
我有如下数据集。
client-Id Name HasCar HasHome
A01 ABC Y N
A01 ABC N N
B01 EFG N N
B01 EFG N Y
从这里我需要为每个客户派生一行,无论他有车还是有房。预期输出应如下所示
Client-Id Name HasCar HasHome
A01 ABC Y N
B01 EFG N Y
这需要使用 Hive-QL 来完成
使用 max() 聚合:
select client-Id,Name, max(HasCar) HasCar, max(HasHome) HasHome
from your_table
group by client-Id,Name