dateutil 和闰年
dateutil and leap years
如果我有以下字符串列表:
a = ['Loc_RaffertytoLong_2004_02_21',
'Loc_RaffertytoLong_2004_02_22',
'Loc_RaffertytoLong_2004_02_23',
'Loc_RaffertytoLong_2004_02_24',
'Loc_RaffertytoLong_2004_02_26',
'Loc_RaffertytoLong_2004_02_27',
'Loc_RaffertytoLong_2004_02_28',
'Loc_RaffertytoLong_2004_02_29']
然后我尝试使用 dateutil
:
来解析日期
from dateutil import parse as dparse
for i in a:
print(dparse.parse(i,fuzzy=True))
我得到打印输出:
2019-02-21 00:00:00
2019-02-22 00:00:00
2019-02-23 00:00:00
2019-02-24 00:00:00
2019-02-26 00:00:00
2019-02-27 00:00:00
2019-02-28 00:00:00
错误:
ValueError: ('Unknown string format:', 'Loc_RaffertytoLong_2004_02_29')
我不知道为什么 2004 年是闰年。
如果您查看输出,dateutil
会将您的日期解释为 2019 年的日期(不是 闰年)。
通过更改行,我能够使您的代码成功:
print(dparse.parse(i,fuzzy=True))
至:
print(dparse.parse('-'.join(i.split('_')[2:])))
当我 运行 整个块时,我得到输出:
2004-02-21 00:00:00
2004-02-22 00:00:00
2004-02-23 00:00:00
2004-02-24 00:00:00
2004-02-26 00:00:00
2004-02-27 00:00:00
2004-02-28 00:00:00
2004-02-29 00:00:00
有趣的是,如果我们像这样加入下划线:
print(dparse.parse('_'.join(i.split('_')[2:])))
它还将日期解释为 2019 年。这让我觉得问题在于 dateutil
如何处理下划线。
您也可以简单地将下划线替换为破折号:
from dateutil import parser
for i in a:
print(parser.parse(i.replace('_','-'), fuzzy=True))
打印与上面相同的输出。
如果我有以下字符串列表:
a = ['Loc_RaffertytoLong_2004_02_21',
'Loc_RaffertytoLong_2004_02_22',
'Loc_RaffertytoLong_2004_02_23',
'Loc_RaffertytoLong_2004_02_24',
'Loc_RaffertytoLong_2004_02_26',
'Loc_RaffertytoLong_2004_02_27',
'Loc_RaffertytoLong_2004_02_28',
'Loc_RaffertytoLong_2004_02_29']
然后我尝试使用 dateutil
:
from dateutil import parse as dparse
for i in a:
print(dparse.parse(i,fuzzy=True))
我得到打印输出:
2019-02-21 00:00:00
2019-02-22 00:00:00
2019-02-23 00:00:00
2019-02-24 00:00:00
2019-02-26 00:00:00
2019-02-27 00:00:00
2019-02-28 00:00:00
错误:
ValueError: ('Unknown string format:', 'Loc_RaffertytoLong_2004_02_29')
我不知道为什么 2004 年是闰年。
如果您查看输出,dateutil
会将您的日期解释为 2019 年的日期(不是 闰年)。
通过更改行,我能够使您的代码成功:
print(dparse.parse(i,fuzzy=True))
至:
print(dparse.parse('-'.join(i.split('_')[2:])))
当我 运行 整个块时,我得到输出:
2004-02-21 00:00:00
2004-02-22 00:00:00
2004-02-23 00:00:00
2004-02-24 00:00:00
2004-02-26 00:00:00
2004-02-27 00:00:00
2004-02-28 00:00:00
2004-02-29 00:00:00
有趣的是,如果我们像这样加入下划线:
print(dparse.parse('_'.join(i.split('_')[2:])))
它还将日期解释为 2019 年。这让我觉得问题在于 dateutil
如何处理下划线。
您也可以简单地将下划线替换为破折号:
from dateutil import parser
for i in a:
print(parser.parse(i.replace('_','-'), fuzzy=True))
打印与上面相同的输出。