如何 'exactly' 在一系列日期字符串上使用 .to_datetime?

How to 'exactly' use .to_datetime on a series of date strings?

我正在尝试将一系列日期字符串转换为日期。但我发现即使 'exact' 参数设置为 True,当字符串中没有日期值时,.to_datetime 会添加默认值 01.

PS: 我正在使用 pandas 0.24.2

data = np.array(['2014-10','2015-06/07','20-14-08','2a115-09'])

ser = pd.Series(data)

pd.to_datetime(ser, errors='coerce', format='%Y-%m-%d', exact=True)

#Result:
0   2014-10-01
1          NaT
2          NaT
3          NaT
dtype: datetime64[ns]

#Expected
0   NaT
1   NaT
2   NaT
3   NaT
dtype: datetime64[ns]

您可以尝试有条件地检查日期格式是否存在 str.matchnp.where:

注意我又添加了一个日期来展示正确的结果

data = np.array(['2014-10','2015-06/07','20-14-08','2a115-09', '2018-09-20'])

m = pd.Series(data).str.match('\d{4}-\d{2}-\d{2}')
data_new = pd.Series(np.where(m, 
                              pd.to_datetime(data, format='%Y-%m-%d',errors='coerce'), 
                              np.datetime64('NaT')))
0          NaT
1          NaT
2          NaT
3          NaT
4   2018-09-20
dtype: datetime64[ns]