查找两行中日期之间的差异,其中 Python 中的一行可以为空

Finding difference between dates in two rows where one can be null in Python

我有一个包含两个日期时间列的数据集(假设 Call_Date 和 Transaction_Date)。 Call_Date 始终存在,因为我们只是在寻找能够接触到消费者的实例。然后,如果消费者进行交易,我们将填充 Transaction_Date。因此,Transaction_date 并不总是被填充。

我想知道的是,当两个日期都被填充时,消费者在调用后多少天进行了交易,而不删除消费者未进行交易的情况。

有什么办法吗?

最小示例

df = pd.DataFrame({'Customer': ['ABC','XYZ','PQR'],
                   'Call_Date': ['12/8/2021 2:31:07 PM','20/8/2021 5:27:02 AM','5/8/2021 7:29:40 PM'],
                   'Transaction_Date': ['16/8/2021 9:21:58 PM', pd.NaT, pd.NaT]})

正在为我工​​作。请检查所附图片以查看输出

from dateutil.parser import *
import pandas as pd
import numpy as np

df = pd.DataFrame({'Customer': ['ABC','XYZ','PQR'],
                   'Call_Date': ['12/8/2021 2:31:07 PM','20/8/2021 5:27:02 AM','5/8/2021 7:29:40 PM'],
                   'Transaction_Date': ['16/8/2021 9:21:58 PM','','']})

df['DUR'] = df.apply(lambda x : parse(x.Call_Date,fuzzy=True) - parse(x.Transaction_Date,fuzzy=True) if \
                     len(x.Transaction_Date) != 0 else np.nan, axis=1)

另一种方法可以使用如下,包括一个函数 diff() 来实现异常处理,所以现在它对任何类型都不是问题 Null/String/datetime。

请检查库文档:https://dateutil.readthedocs.io/en/stable/parser.html

def diff(datetime_old, datetime_new):
    try: return abs(parse(str(datetime_new), fuzzy=True) - parse(str(datetime_old), fuzzy=True))
    except: return np.nan

df['DUR'] = df.apply(lambda x : diff(x.Call_Date, x.Transaction_Date) if pd.notnull(x.Transaction_Date) else np.nan, axis=1)