pandas 重新采样 - 5 分钟块(不是每小时的第 5 分钟)

pandas resample - 5 minute blocks (not every 5th minute of the hour)

我每分钟都会采集一些数据,我想在 5 分钟的片段中重新采样。

df.resample("5T").mean()

这具有每小时每五分钟重新采样的效果。 IE 12:00,12:05,12:10,12:15 等

如果我的最后一个数据点是 12:07

怎么办

有没有办法以 5 分钟为单位对结果进行重新采样(也向后,所以最后的最新时间 100% 包含 5 分钟的数据)

12:07、12:02、11:07 等

通过 index 的第一个值使用 origin 参数:

rng = pd.date_range('2017-04-03 12:07:00', periods=10, freq='min')
df = pd.DataFrame({'a': range(10)}, index=rng)  

df = df.resample("5T", origin=df.index[0]).mean()
print (df)
                     a
2017-04-03 12:07:00  2
2017-04-03 12:12:00  7