Dask Dataframe groupby 没有 len()
Dask Dataframe groupby has no len()
如果您有一个基于 dask 数据帧的 groupby 对象,为什么 len(<groupby object>)
return 会出错? (错误或功能)
这还没有实现。您可能想提出一个问题(或者更好的是,一个拉取请求)。务实地说,我只会在您的分组对象上调用 nunique
之前
g = df.groupby(df.x + df.y)
result = len(g)
之后
result = (df.x + df.y).nunique()
在操作上这是更好的,因为它可以是惰性的(Python 中 len
的结果必须是一个具体的整数)并且因为你可以选择 nunique_approx
变体,它将快得多。
如果您有一个基于 dask 数据帧的 groupby 对象,为什么 len(<groupby object>)
return 会出错? (错误或功能)
这还没有实现。您可能想提出一个问题(或者更好的是,一个拉取请求)。务实地说,我只会在您的分组对象上调用 nunique
之前
g = df.groupby(df.x + df.y)
result = len(g)
之后
result = (df.x + df.y).nunique()
在操作上这是更好的,因为它可以是惰性的(Python 中 len
的结果必须是一个具体的整数)并且因为你可以选择 nunique_approx
变体,它将快得多。