查找两行中日期之间的差异,其中 Python 中的一行可以为空
Finding difference between dates in two rows where one can be null in Python
我有一个包含两个日期时间列的数据集(假设 Call_Date 和 Transaction_Date)。 Call_Date 始终存在,因为我们只是在寻找能够接触到消费者的实例。然后,如果消费者进行交易,我们将填充 Transaction_Date。因此,Transaction_date 并不总是被填充。
我想知道的是,当两个日期都被填充时,消费者在调用后多少天进行了交易,而不删除消费者未进行交易的情况。
有什么办法吗?
最小示例
df = pd.DataFrame({'Customer': ['ABC','XYZ','PQR'],
'Call_Date': ['12/8/2021 2:31:07 PM','20/8/2021 5:27:02 AM','5/8/2021 7:29:40 PM'],
'Transaction_Date': ['16/8/2021 9:21:58 PM', pd.NaT, pd.NaT]})
正在为我工作。请检查所附图片以查看输出
from dateutil.parser import *
import pandas as pd
import numpy as np
df = pd.DataFrame({'Customer': ['ABC','XYZ','PQR'],
'Call_Date': ['12/8/2021 2:31:07 PM','20/8/2021 5:27:02 AM','5/8/2021 7:29:40 PM'],
'Transaction_Date': ['16/8/2021 9:21:58 PM','','']})
df['DUR'] = df.apply(lambda x : parse(x.Call_Date,fuzzy=True) - parse(x.Transaction_Date,fuzzy=True) if \
len(x.Transaction_Date) != 0 else np.nan, axis=1)
另一种方法可以使用如下,包括一个函数 diff() 来实现异常处理,所以现在它对任何类型都不是问题 Null/String/datetime。
请检查库文档:https://dateutil.readthedocs.io/en/stable/parser.html
def diff(datetime_old, datetime_new):
try: return abs(parse(str(datetime_new), fuzzy=True) - parse(str(datetime_old), fuzzy=True))
except: return np.nan
df['DUR'] = df.apply(lambda x : diff(x.Call_Date, x.Transaction_Date) if pd.notnull(x.Transaction_Date) else np.nan, axis=1)
我有一个包含两个日期时间列的数据集(假设 Call_Date 和 Transaction_Date)。 Call_Date 始终存在,因为我们只是在寻找能够接触到消费者的实例。然后,如果消费者进行交易,我们将填充 Transaction_Date。因此,Transaction_date 并不总是被填充。
我想知道的是,当两个日期都被填充时,消费者在调用后多少天进行了交易,而不删除消费者未进行交易的情况。
有什么办法吗?
最小示例
df = pd.DataFrame({'Customer': ['ABC','XYZ','PQR'],
'Call_Date': ['12/8/2021 2:31:07 PM','20/8/2021 5:27:02 AM','5/8/2021 7:29:40 PM'],
'Transaction_Date': ['16/8/2021 9:21:58 PM', pd.NaT, pd.NaT]})
正在为我工作。请检查所附图片以查看输出
from dateutil.parser import *
import pandas as pd
import numpy as np
df = pd.DataFrame({'Customer': ['ABC','XYZ','PQR'],
'Call_Date': ['12/8/2021 2:31:07 PM','20/8/2021 5:27:02 AM','5/8/2021 7:29:40 PM'],
'Transaction_Date': ['16/8/2021 9:21:58 PM','','']})
df['DUR'] = df.apply(lambda x : parse(x.Call_Date,fuzzy=True) - parse(x.Transaction_Date,fuzzy=True) if \
len(x.Transaction_Date) != 0 else np.nan, axis=1)
另一种方法可以使用如下,包括一个函数 diff() 来实现异常处理,所以现在它对任何类型都不是问题 Null/String/datetime。
请检查库文档:https://dateutil.readthedocs.io/en/stable/parser.html
def diff(datetime_old, datetime_new):
try: return abs(parse(str(datetime_new), fuzzy=True) - parse(str(datetime_old), fuzzy=True))
except: return np.nan
df['DUR'] = df.apply(lambda x : diff(x.Call_Date, x.Transaction_Date) if pd.notnull(x.Transaction_Date) else np.nan, axis=1)