如何根据 Python 中的特定日期提取前 2 年的数据?
How to extract data from previous 2 years based on particular date in Python?
我有一个 csv 文件,其中包含过去 3 年的时间序列月度数据。根据今天的日期,我想只读前两年的数据来预测未来。
Data file example (has data from 01-01-15 to 31-10-19):
Date,Value
01-01-17,2
01-02-17,5
01-03-17,8
01-04-17,4
01-05-17,2
01-06-17,9
01-07-17,8
01-08-17,7
01-09-17,5
01-10-17,1
01-11-17,2
01-12-17,3
01-01-18,5
01-02-18,6
01-03-18,8
01-04-18,2
01-05-18,5
01-06-18,6
想要的结果:
如果今天的日期是 01/01/19,我希望我的训练数据是 01/01/17 - 31/12/18 的数据。
我试过了:
df[df['date'] > (pd.to_datetime('2019-01-01', format = '%Y-%m-%d') - relativedelta(years = 2))]
但是,我获取的数据是从 01-01-17 到 31-10-19(最后一条记录),而不是从 01-01-17 到 31-12-18。
您可以尝试以下方法
>>> from dateutil.relativedelta import relativedelta
>>> df[df.Date > datetime.now() - relativedelta(years=2)]
Date Value
12 2018-01-01 5
13 2018-01-02 6
14 2018-01-03 8
15 2018-01-04 2
16 2018-01-05 5
17 2018-01-06 6
更新
>>> from dateutil.relativedelta import relativedelta
>>> from datetime import date
>>> start_date = pd.Timestamp(datetime.now() - relativedelta(years=2))
>>> end_date = pd.Timestamp(date(date.today().year-1, 12, 31))
>>> df[(df.Date >= start_date) & (df.Date <= end_date)]
Date Value
12 2018-01-01 5
13 2018-01-02 6
14 2018-01-03 8
15 2018-01-04 2
16 2018-01-05 5
17 2018-01-06 6
我有一个 csv 文件,其中包含过去 3 年的时间序列月度数据。根据今天的日期,我想只读前两年的数据来预测未来。
Data file example (has data from 01-01-15 to 31-10-19):
Date,Value
01-01-17,2
01-02-17,5
01-03-17,8
01-04-17,4
01-05-17,2
01-06-17,9
01-07-17,8
01-08-17,7
01-09-17,5
01-10-17,1
01-11-17,2
01-12-17,3
01-01-18,5
01-02-18,6
01-03-18,8
01-04-18,2
01-05-18,5
01-06-18,6
想要的结果:
如果今天的日期是 01/01/19,我希望我的训练数据是 01/01/17 - 31/12/18 的数据。
我试过了:
df[df['date'] > (pd.to_datetime('2019-01-01', format = '%Y-%m-%d') - relativedelta(years = 2))]
但是,我获取的数据是从 01-01-17 到 31-10-19(最后一条记录),而不是从 01-01-17 到 31-12-18。
您可以尝试以下方法
>>> from dateutil.relativedelta import relativedelta
>>> df[df.Date > datetime.now() - relativedelta(years=2)]
Date Value
12 2018-01-01 5
13 2018-01-02 6
14 2018-01-03 8
15 2018-01-04 2
16 2018-01-05 5
17 2018-01-06 6
更新
>>> from dateutil.relativedelta import relativedelta
>>> from datetime import date
>>> start_date = pd.Timestamp(datetime.now() - relativedelta(years=2))
>>> end_date = pd.Timestamp(date(date.today().year-1, 12, 31))
>>> df[(df.Date >= start_date) & (df.Date <= end_date)]
Date Value
12 2018-01-01 5
13 2018-01-02 6
14 2018-01-03 8
15 2018-01-04 2
16 2018-01-05 5
17 2018-01-06 6