如何使用 Alibaba PyODPS 查找组内的累计计数?
How can I find cumulative count within a group using Alibaba PyODPS?
让我们假设我有一个名为 Iris 的数据框,其中包含名称、sepallength、sepalwidth、petalwidth 和 petallength 作为列。我想找到一个组内 sepallength 的累计计数。
我的代码:
iris['name', 'sepallength', iris.groupby('name').sort('sepallength').sepallength.count()].head(5)
但是它显示的结果是错误的,我错过了什么?
使用cumcount
代替count
,前一个用于window功能,后一个用于聚合。
iris['name', 'sepallength', iris.groupby('name').sort('sepallength').sepallength.cumcount()].head(5)
让我们假设我有一个名为 Iris 的数据框,其中包含名称、sepallength、sepalwidth、petalwidth 和 petallength 作为列。我想找到一个组内 sepallength 的累计计数。
我的代码:
iris['name', 'sepallength', iris.groupby('name').sort('sepallength').sepallength.count()].head(5)
但是它显示的结果是错误的,我错过了什么?
使用cumcount
代替count
,前一个用于window功能,后一个用于聚合。
iris['name', 'sepallength', iris.groupby('name').sort('sepallength').sepallength.cumcount()].head(5)