在 Hive 中按问题分组
Group by issue in Hive
我 table 有三个字段 Tab1(user_id,flag1,flag2)
。示例数据:
user_id Flag1 Flag2
10001 0 1
10001 1 0
10001 0 1
10002 1 0
10002 0 1
如何获得输出为:
User_id. Flag1. Flag2
10001 1 1
10002 1 1
使用 max() 并按 user_id:
分组
select user_id, max(flag1) as flag1, max(flag2) as flag2
from Tab1
group by user_id;
我 table 有三个字段 Tab1(user_id,flag1,flag2)
。示例数据:
user_id Flag1 Flag2
10001 0 1
10001 1 0
10001 0 1
10002 1 0
10002 0 1
如何获得输出为:
User_id. Flag1. Flag2
10001 1 1
10002 1 1
使用 max() 并按 user_id:
分组select user_id, max(flag1) as flag1, max(flag2) as flag2
from Tab1
group by user_id;