Python:将 NA 与 relativedelta 相加

Python: Sum NAs with relativedelta

我在包含 327 条记录的数据集中有 2 列:

 #   Column                     Non-Null Count  Dtype         
---  ------                     --------------  -----               
 0   JD                         327 non-null    datetime64[ns]       
 1   CD                         312 non-null    Int64

我想生成第三个 (['theoretical_eoc']),它给我 [JD] 中保存的日期加上 [CD] 中指定的月份数。但是当我使用以下方法定义这个新列时:

df['theoretical_eoc'] = turnover.apply(lambda x: x.JD + relativedelta(months=x.CD), axis=1)

我收到以下错误消息:

TypeError: int() argument must be a string, a bytes-like object or a number, not 'NAType'

所以,我定义了一个函数来放置 NaT,以防任何列中的一个值是 NA:

def rd_na(a, b):
    if pd.isnull(a) or pd.isnull(b):
        pd.NaT
    else:
        a + relativedelta(months = b)

但是当我应用它时:

df['theoretical_eoc'] = turnover.apply(lambda x: rd_na(x.JD, x.CD), axis=1)

结果是一列充满 None 个值,而我期望 datetime64[ns] 和一些 NaT。我究竟做错了什么?我怎样才能完成这个任务?

您在 rd_na 函数中缺少 returns

def rd_na(a, b):
    if pd.isnull(a) or pd.isnull(b):
        return pd.NaT
    else:
        return a + relativedelta(months = b)

考虑使用 pandas 的 DateOffset,因为它处理 pd.NaT

from pandas.tseries.offsets import DateOffset

df['theoretical_eoc'] = turnover.apply(lambda x: x.JD +
                                       DateOffset(months=x.CD), axis=1)