Dask DataFrame 基于时间戳聚合数据

Dask DataFrame aggregate data based on timestamp

我有一个带有日期时间列和其他数字列的 Dask DataFrame。 DataFrame 行中的连续条目相差固定时间间隔 t 分钟。我想每小时聚合一次数据,以便每小时计算其他列数据的行的平均值。如何做到这一点,可以 groupby with date-time include specifying aggregation interval?

您可能需要 resample 方法。

你的情况

import dask

# Synthetic data
df = dask.datasets.timeseries()

# Compute the average for each hour
df.resample('H').mean().compute()