Python:将 NA 与 relativedelta 相加
Python: Sum NAs with relativedelta
我在包含 327 条记录的数据集中有 2 列:
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 JD 327 non-null datetime64[ns]
1 CD 312 non-null Int64
我想生成第三个 (['theoretical_eoc']
),它给我 [JD]
中保存的日期加上 [CD]
中指定的月份数。但是当我使用以下方法定义这个新列时:
df['theoretical_eoc'] = turnover.apply(lambda x: x.JD + relativedelta(months=x.CD), axis=1)
我收到以下错误消息:
TypeError: int() argument must be a string, a bytes-like object or a number, not 'NAType'
所以,我定义了一个函数来放置 NaT
,以防任何列中的一个值是 NA:
def rd_na(a, b):
if pd.isnull(a) or pd.isnull(b):
pd.NaT
else:
a + relativedelta(months = b)
但是当我应用它时:
df['theoretical_eoc'] = turnover.apply(lambda x: rd_na(x.JD, x.CD), axis=1)
结果是一列充满 None
个值,而我期望 datetime64[ns]
和一些 NaT
。我究竟做错了什么?我怎样才能完成这个任务?
您在 rd_na
函数中缺少 returns
def rd_na(a, b):
if pd.isnull(a) or pd.isnull(b):
return pd.NaT
else:
return a + relativedelta(months = b)
考虑使用 pandas 的 DateOffset,因为它处理 pd.NaT
from pandas.tseries.offsets import DateOffset
df['theoretical_eoc'] = turnover.apply(lambda x: x.JD +
DateOffset(months=x.CD), axis=1)
我在包含 327 条记录的数据集中有 2 列:
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 JD 327 non-null datetime64[ns]
1 CD 312 non-null Int64
我想生成第三个 (['theoretical_eoc']
),它给我 [JD]
中保存的日期加上 [CD]
中指定的月份数。但是当我使用以下方法定义这个新列时:
df['theoretical_eoc'] = turnover.apply(lambda x: x.JD + relativedelta(months=x.CD), axis=1)
我收到以下错误消息:
TypeError: int() argument must be a string, a bytes-like object or a number, not 'NAType'
所以,我定义了一个函数来放置 NaT
,以防任何列中的一个值是 NA:
def rd_na(a, b):
if pd.isnull(a) or pd.isnull(b):
pd.NaT
else:
a + relativedelta(months = b)
但是当我应用它时:
df['theoretical_eoc'] = turnover.apply(lambda x: rd_na(x.JD, x.CD), axis=1)
结果是一列充满 None
个值,而我期望 datetime64[ns]
和一些 NaT
。我究竟做错了什么?我怎样才能完成这个任务?
您在 rd_na
函数中缺少 returns
def rd_na(a, b):
if pd.isnull(a) or pd.isnull(b):
return pd.NaT
else:
return a + relativedelta(months = b)
考虑使用 pandas 的 DateOffset,因为它处理 pd.NaT
from pandas.tseries.offsets import DateOffset
df['theoretical_eoc'] = turnover.apply(lambda x: x.JD +
DateOffset(months=x.CD), axis=1)