Pandas:Select 星期日 23:00-星期五 23:00 之间的数据(1 年跨度)

Pandas: Select data between Sunday 23:00-Friday 23:00 (1 year span)

我有跨越整个 2015 年的以分钟为单位的欧元兑美元汇率的时间序列,包括非交易日 (ex.weekends),其中时间序列值在整个非交易期间重复.

我需要通过 select 只收集周日 23:00 下午和周五 23:00 下午之间的数据来丢弃这些时间段。

我还没有找到 Pandas 的解决方案(我知道如何在一天内的时间之间 select 和几天之间的 select )。我可以简单地将时间移动 1 小时,然后 select 仅移动工作日,但这是一个次优的解决方案。

知道如何实现吗?

数据示例:

Local time,              Open,    High,    Low,     Close,   Volume
02.01.2015 22:58:00.000, 1.20008, 1.20016, 1.20006, 1.20009, 119.84
02.01.2015 22:59:00.000, 1.20009, 1.20018, 1.20004, 1.20017, 40.61
02.01.2015 23:00:00.000, 1.20017, 1.20017, 1.20017, 1.20017, 0
02.01.2015 23:01:00.000, 1.20017, 1.20017, 1.20017, 1.20017, 0
...
04.01.2015 22:58:00.000, 1.20017, 1.20017, 1.20017, 1.20017, 0
04.01.2015 22:59:00.000, 1.20017, 1.20017, 1.20017, 1.20017, 0
04.01.2015 23:00:00.000, 1.19495, 1.19506, 1.19358, 1.19410, 109.4
04.01.2015 23:01:00.000, 1.19408, 1.19414, 1.19052, 1.19123, 108.12
...

考虑 pd.DataFrame dfpd.tseries.index.DatetimeIndex tidx

tidx = pd.date_range('2010-01-01', '2011-01-01', freq='H')
df = pd.DataFrame(np.ones((tidx.shape[0], 2)), tidx, columns=list('AB'))

我们可以构建一系列要过滤的值

day_hour = (((tidx.weekday + 1) % 7) * 100) + tidx.hour

确定周五之前的值 23:00

before_friday = day_hour <= 523

周日之后 23:00

after_sunday = day_hour >= 23

根据以上条件过滤我们的df

df[before_friday & after_sunday]