如何从具有初始日期条件的 pandas 数据框中删除行
How to remove rows from pandas dataframe with an initial date condition
我有一个 pandas 数据框,其中一列包含日期。
我的 objective 是设置一个初始日期,并丢弃该日期之前的所有数据帧行。
数据框片段:
ID fecha
519457 25/02/2020 10:03
519462 25/02/2020 10:07
519468 25/02/2020 10:12
... ...
我一直在尝试使用的代码如下:
xls=pd.ExcelFile(r'/home/.../Final.xlsx')
xls.sheet_names
df=pd.read_excel(xls,"Hoja1")
Date_initial=['25/02/2020 10:07:00']
df=df.drop(df[["fecha"]<Date_initial].index)
这没有用。
我还尝试将最后一行替换为:
df[(df['fecha']>=Date_initial)]
结果我得到了错误:
ValueError: Lengths must match to compare
我是不是在表达中遗漏了什么,或者是以完全错误的方式来做这件事?
感谢您的输入!
可能是这样的:
Date_initial='25/02/2020 10:07:00'
df=df[df["fecha"]>=Date_initial]]
此外,我建议使用 datetime
类型:
df = pd.read_excel(xls, 'Hoja1', parse_dates=['fecha'], dayfirst=True)
Date_initial = pd.to_datetime('25/02/2020 10:07:00')
df = df[df['fecha'] >= Date_initial]
我有一个 pandas 数据框,其中一列包含日期。
我的 objective 是设置一个初始日期,并丢弃该日期之前的所有数据帧行。 数据框片段:
ID fecha
519457 25/02/2020 10:03
519462 25/02/2020 10:07
519468 25/02/2020 10:12
... ...
我一直在尝试使用的代码如下:
xls=pd.ExcelFile(r'/home/.../Final.xlsx')
xls.sheet_names
df=pd.read_excel(xls,"Hoja1")
Date_initial=['25/02/2020 10:07:00']
df=df.drop(df[["fecha"]<Date_initial].index)
这没有用。 我还尝试将最后一行替换为:
df[(df['fecha']>=Date_initial)]
结果我得到了错误:
ValueError: Lengths must match to compare
我是不是在表达中遗漏了什么,或者是以完全错误的方式来做这件事? 感谢您的输入!
可能是这样的:
Date_initial='25/02/2020 10:07:00'
df=df[df["fecha"]>=Date_initial]]
此外,我建议使用 datetime
类型:
df = pd.read_excel(xls, 'Hoja1', parse_dates=['fecha'], dayfirst=True)
Date_initial = pd.to_datetime('25/02/2020 10:07:00')
df = df[df['fecha'] >= Date_initial]