GROUP BY 语句 HiveQL
GROUP BY statement HiveQL
我是 Hive 的新手。我的问题是为什么我们需要在执行 GROUP BY 时使用 collect_set(col)?
select 歌手,collect_set(歌曲)来自歌曲列表 GROUP BY 歌手;;
非常感谢任何帮助。提前致谢!
兄弟!!恰恰相反:)
所有 Summation/aggregation 事物都需要分组依据。
在您的查询中,当您尝试执行 collect_set(col) 时,您需要一个分组依据。
所以在你的例子中,你试图将歌手演唱的所有歌曲归为一组。因此 collect_set(songs)
的分组依据
我是 Hive 的新手。我的问题是为什么我们需要在执行 GROUP BY 时使用 collect_set(col)?
select 歌手,collect_set(歌曲)来自歌曲列表 GROUP BY 歌手;;
非常感谢任何帮助。提前致谢!
兄弟!!恰恰相反:)
所有 Summation/aggregation 事物都需要分组依据。 在您的查询中,当您尝试执行 collect_set(col) 时,您需要一个分组依据。
所以在你的例子中,你试图将歌手演唱的所有歌曲归为一组。因此 collect_set(songs)
的分组依据