GROUP BY 语句 HiveQL

GROUP BY statement HiveQL

我是 Hive 的新手。我的问题是为什么我们需要在执行 GROUP BY 时使用 collect_set(col)?

select 歌手,collect_set(歌曲)来自歌曲列表 GROUP BY 歌手;;

非常感谢任何帮助。提前致谢!

兄弟!!恰恰相反:)

所有 Summation/aggregation 事物都需要分组依据。 在您的查询中,当您尝试执行 collect_set(col) 时,您需要一个分组依据。

所以在你的例子中,你试图将歌手演唱的所有歌曲归为一组。因此 collect_set(songs)

的分组依据