Spark 分组数据框详细信息

Spark grouped Dataframe details

如何实现分组的键spark-dataframe

还有一个问题:

pyspark.sql.group.GroupedData 对象包括什么?

How can I achieve keys of a grouped spark-dataframe?

如果不汇总数据并收集结果,这是不可能的。只是:

会更容易
df.select(grouping_columns).distinct()

What does a pyspark.sql.group.GroupedData object include?

只是执行计划:

  • How to serialize pyspark GroupedData object?
  • how to store grouped data into json in pyspark