如何计算一组行的唯一值并使用该值为所有记录创建一列?
How to compute unique values for a group of rows and create a column for all records using that value?
我有一个只有 'Name' 和 'Value' 列的 dask 数据框,类似于下面的 table。
如何计算 'Average' 列?我在 dash 中尝试了 groupby,但这只给了我一个包含 2 条记录的数据框,其中包含 A 和 B 的平均值。
您可以在 Name
上加入原来的 table 和新的。来自 https://docs.dask.org/en/latest/dataframe-joins.html:
small = small.repartition(npartitions=1)
result = big.merge(small)
我有一个只有 'Name' 和 'Value' 列的 dask 数据框,类似于下面的 table。
如何计算 'Average' 列?我在 dash 中尝试了 groupby,但这只给了我一个包含 2 条记录的数据框,其中包含 A 和 B 的平均值。
您可以在 Name
上加入原来的 table 和新的。来自 https://docs.dask.org/en/latest/dataframe-joins.html:
small = small.repartition(npartitions=1)
result = big.merge(small)