如何使用 Alibaba PyODPS 查找组内的累计计数?

How can I find cumulative count within a group using Alibaba PyODPS?

让我们假设我有一个名为 Iris 的数据框,其中包含名称、sepallength、sepalwidth、petalwidth 和 petallength 作为列。我想找到一个组内 sepallength 的累计计数。

我的代码:

iris['name', 'sepallength', iris.groupby('name').sort('sepallength').sepallength.count()].head(5)

但是它显示的结果是错误的,我错过了什么?

使用cumcount代替count,前一个用于window功能,后一个用于聚合。

iris['name', 'sepallength', iris.groupby('name').sort('sepallength').sepallength.cumcount()].head(5)