Pandas 创建没有周末的日期范围

Pandas Create Range of Dates Without Weekends

给定以下数据框:

import pandas as pd
df=pd.DataFrame({'A':['a','b','c'],
        'first_date':['2015-08-31 00:00:00','2015-08-24 00:00:00','2015-08-25 00:00:00']})
df.first_date=pd.to_datetime(df.first_date) #(dtype='<M8[ns]')
df['last_date']=pd.to_datetime('5/6/2016') #(dtype='datetime64[ns]')
df

    A   first_date   last_date
0   a   2015-08-31  2016-05-06
1   b   2015-08-24  2016-05-06
2   c   2015-08-25  2016-05-06

我想创建一个新列,其中包含 'first_date' 和 'last_date' 之间的日期列表(或数组),不包括周末。

到目前为止,我试过这个:

pd.date_range(df['first_date'],df['last_date'])

...但出现此错误:

TypeError: Cannot convert input to Timestamp

我之前也试过这个pd.date_range...

pd.Timestamp(df['first_date'])

...但没有骰子。

提前致谢!

P.S.:

在这个障碍之后,我将尝试查看其他日期列表,如果它们落在生成的数组中('A' 中的每一行),然后从列表或数组中减去它们) .我会 post 它作为一个单独的问题。

freq='B' 给你工作日,或者没有周末。

你的错误:

TypeError: Cannot convert input to Timestamp

是您将系列传递给 pd.date_range 函数的结果,而它期望 Timestamp

而是使用 apply

但是,我仍然发现将列表放入数据帧的特定单元格中很棘手。我使用的方式是使用一个pd.Series([mylist])。请注意,它是一个列表的列表。如果只是 pd.Series(mylist) pandas 会将列表转换成一个系列,你会得到一系列系列,这是一个数据框。

尝试:

def fnl(x):
    l = pd.date_range(x.loc['first_date'], x.loc['last_date'], freq='B')
    return pd.Series([l])

df['range'] = df.apply(fnl, axis=1)