在 Pandas Groupby 期间保留时间戳列
Preserve Timestamp Column during Pandas Groupby
我有一个相当大的 pandas df,我想按时间戳进行聚合。时间戳是粒度级的(一秒)。 Post 聚合,我希望 df 保留该时间戳的第一个实例,但按一分钟周期聚合以下数据。
Original:
Timestamp Column
22-02-23 9:30:00 1
22-02-23 9:30:01 4
...
22-02-23 9:33:04 4
22-02-23 9:33:05 7
Grouped:
Timestamp Column
22-02-23 9:30:00 5
...
22-02-23 9:33:04 11
是否有 pandas 功能?或者这个聚合是否需要手动完成?
您可以使用:
df["Timestamp"] = pd.to_datetime(df["Timestamp"])
df["Hour_Minute"] = df["Timestamp"].apply(lambda x: x.strftime("%Y-%m-%d %H:%M"))
df.groupby("Hour_Minute").first()
我有一个相当大的 pandas df,我想按时间戳进行聚合。时间戳是粒度级的(一秒)。 Post 聚合,我希望 df 保留该时间戳的第一个实例,但按一分钟周期聚合以下数据。
Original:
Timestamp Column
22-02-23 9:30:00 1
22-02-23 9:30:01 4
...
22-02-23 9:33:04 4
22-02-23 9:33:05 7
Grouped:
Timestamp Column
22-02-23 9:30:00 5
...
22-02-23 9:33:04 11
是否有 pandas 功能?或者这个聚合是否需要手动完成?
您可以使用:
df["Timestamp"] = pd.to_datetime(df["Timestamp"])
df["Hour_Minute"] = df["Timestamp"].apply(lambda x: x.strftime("%Y-%m-%d %H:%M"))
df.groupby("Hour_Minute").first()