Dask Dataframe groupby 没有 len()

Dask Dataframe groupby has no len()

如果您有一个基于 dask 数据帧的 groupby 对象,为什么 len(<groupby object>) return 会出错? (错误或功能)

这还没有实现。您可能想提出一个问题(或者更好的是,一个拉取请求)。务实地说,我只会在您的分组对象上调用 nunique

之前

g = df.groupby(df.x + df.y)
result = len(g)

之后

result = (df.x + df.y).nunique()

在操作上这是更好的,因为它可以是惰性的(Python 中 len 的结果必须是一个具体的整数)并且因为你可以选择 nunique_approx 变体,它将快得多。