在 Hive 中按问题分组

Group by issue in Hive

我 table 有三个字段 Tab1(user_id,flag1,flag2)。示例数据:

user_id    Flag1     Flag2
10001       0          1 
10001       1          0
10001       0          1
10002       1          0
10002       0          1 

如何获得输出为:

User_id.   Flag1.     Flag2
10001       1         1
10002       1         1

使用 max() 并按 user_id:

分组
select user_id, max(flag1) as flag1, max(flag2) as flag2
  from Tab1
 group by user_id;