使用日期时间索引合并两个数据框
merging two dataframe using datetime index
我有两个数据框(df5和dfS),保存空气污染数据。可以看出,它们的索引是 DateTime。在 DateTime 索引中,第二个读数不同。所以我想在他们阅读的日期、小时和分钟相同时合并它们,而忽略第二个。
df5:
dfS:
下面是我的代码:
dfG=df5.merge(dfS,left_on='Min', right_on='Min' )
dfG['DATETIME'] = dfG.Date + "_" + dfG.Time
dfG.to_csv('dfG.csv')
dfG.set_index("DATETIME", inplace=True)
#correct the underscores in old datetime format
dfG.index = [" ".join(str(val).split("_")) for val in dfG.index]
可以看出索引不正确,因为我认为 'Min' 是加入的关键。
DfG:
我的问题是:如何根据忽略第二个日期时间索引合并这两个数据框。
如果时间戳上的 秒 不重要,也许这可以帮助:
df5.index = df5.index.map(lambda x: x.replace(second=0))
我有两个数据框(df5和dfS),保存空气污染数据。可以看出,它们的索引是 DateTime。在 DateTime 索引中,第二个读数不同。所以我想在他们阅读的日期、小时和分钟相同时合并它们,而忽略第二个。 df5:
dfS:
下面是我的代码:
dfG=df5.merge(dfS,left_on='Min', right_on='Min' )
dfG['DATETIME'] = dfG.Date + "_" + dfG.Time
dfG.to_csv('dfG.csv')
dfG.set_index("DATETIME", inplace=True)
#correct the underscores in old datetime format
dfG.index = [" ".join(str(val).split("_")) for val in dfG.index]
可以看出索引不正确,因为我认为 'Min' 是加入的关键。
DfG:
我的问题是:如何根据忽略第二个日期时间索引合并这两个数据框。
如果时间戳上的 秒 不重要,也许这可以帮助:
df5.index = df5.index.map(lambda x: x.replace(second=0))