Dask DataFrame 基于时间戳聚合数据
Dask DataFrame aggregate data based on timestamp
我有一个带有日期时间列和其他数字列的 Dask DataFrame。 DataFrame 行中的连续条目相差固定时间间隔 t
分钟。我想每小时聚合一次数据,以便每小时计算其他列数据的行的平均值。如何做到这一点,可以 groupby
with date-time include specifying aggregation interval?
您可能需要 resample
方法。
你的情况
import dask
# Synthetic data
df = dask.datasets.timeseries()
# Compute the average for each hour
df.resample('H').mean().compute()
我有一个带有日期时间列和其他数字列的 Dask DataFrame。 DataFrame 行中的连续条目相差固定时间间隔 t
分钟。我想每小时聚合一次数据,以便每小时计算其他列数据的行的平均值。如何做到这一点,可以 groupby
with date-time include specifying aggregation interval?
您可能需要 resample
方法。
你的情况
import dask
# Synthetic data
df = dask.datasets.timeseries()
# Compute the average for each hour
df.resample('H').mean().compute()