使用 Pandas 有条件地添加天数

Add days to date conditionally using Pandas

我有一个 table 需要添加天数并使用该信息创建一个新列。我遇到的问题是有两个基于不同列的日期计算。这是一个与我正在使用的类似的table:

Type    Name    Date
A       Abe     6/2/2021
B       Joe     6/15/2021
A       Jin     6/25/2021
A       Jen     6/1/2021
B       Pan     6/21/2021
B       Pin     6/22/2021
B       Hon     6/11/2021
A       Hen     6/23/2021
A       Bin     6/23/2021
A       Ban     6/5/2021

我正在尝试将 table 变为 return,其中类型 A 上涨 7 天,类型 B 上涨 2 个工作日:

Type    Name    Date        NewDate
A       Abe     6/2/2021    6/9/2021
B       Joe     6/15/2021   6/19/2021
A       Jin     6/25/2021   7/2/2021
A       Jen     6/1/2021    6/8/2021
B       Pan     6/21/2021   6/23/2021
B       Pin     6/22/2021   6/26/2021
B       Hon     6/11/2021   6/13/2021
A       Hen     6/23/2021   6/30/2021
A       Bin     6/23/2021   6/30/2021
A       Ban     6/5/2021    6/12/2021

到目前为止我试过这些:

import pandas as pd
from pandas.tseries.offsets import BDay
from datetime import datetime, timedelta
df1['NewDate'] = df1.apply(df1['Date'] + timedelta(days=7) 
                 if x=='Emergency' else df1['Date'] + BDay(2) for x in df1['Type'])

不要运行那样,否则你会进入无限循环,否则会花费很长时间。

我也运行这个:

df1['NewDate'] = [df1['Date'] + timedelta(days=7) if i=='Emergency' else df1['Date'] + BDay(2)
                 for i in df1.Type] (also tried with df1[Type] same results.

这会将所有行放在一行中(几乎看起来像它在 jupyter notebook 上 returns 的方式...)

我也试过这个:

df1['NewDate'] = df1['Type'].apply(lambda x: df1['Date'] + timedelta(days=7) if x=='Emergency'
                                   else df1['Date'] + BDay(2))

当我 运行 那个它会遍历类型的每一行并应用正确的逻辑,如果紧急计算按 7 天计算,如果不按工作日计算,问题是每一行returned是在整个table的第一行计算的。

在这一点上我有点迷茫,任何帮助将不胜感激。为了简单起见,它可以在加上 timedelta(7) 和加上 timedelta(2) 时计算。如果我必须添加更多条件,比如在 Name 列上说,也会发生什么变化。

要使用 apply,请尝试:

df["Date"] = pd.to_datetime(df["Date"])
df["NewDate"] = df.apply(lambda x: x["Date"]+BDay(2) if x["Type"]=="B" else x["Date"]+pd.DateOffset(days=7), axis=1)

>>> df
  Type Name       Date    NewDate
0    A  Abe 2021-06-02 2021-06-09
1    B  Joe 2021-06-15 2021-06-17
2    A  Jin 2021-06-25 2021-07-02
3    A  Jen 2021-06-01 2021-06-08
4    B  Pan 2021-06-21 2021-06-23
5    B  Pin 2021-06-22 2021-06-24
6    B  Hon 2021-06-11 2021-06-15
7    A  Hen 2021-06-23 2021-06-30
8    A  Bin 2021-06-23 2021-06-30
9    A  Ban 2021-06-05 2021-06-12

或者,您可以使用 numpy.where:

import numpy as np
df["NewDate"] = np.where(df["Type"]=="B", df["Date"]+BDay(2), df["Date"]+pd.DateOffset(7))