Python/pandas 基于 date_time 索引值的条件语句

Question

我有一个 Pandas 数据框，其时间序列索引基于使用 date_time 应用的日期范围，如下所示：

                     Column A
2016-11-24 00:00:00  4.0
2016-11-24 01:00:00  7.8
2016-11-24 02:00:00  95.1
2016-11-24 03:00:00  78.4
etc

我想做的是创建一个新列，根据索引中的月份将一个因子应用于列 A。

校正因子：9 月 = 1、10 月 = 2、11 月 = 3、12 月 = 4 等

因此，在上面的示例中，因为月份是 11 月，所以结果将是：

                     Column A   Column B
2016-11-24 00:00:00  4.0        12
2016-11-24 01:00:00  7.8        23.4
2016-11-24 02:00:00  95.1       285.3
2016-11-24 03:00:00  78.4       235.2
etc

我已经尝试了很多解决方案，但有些问题。有人有什么建议吗？

Answer 1

我认为您可以从 month 中减去 8，然后减去 multiple，但是在 September 之前的几个月中得到的数字会减少 1:

print (df.index.month - 8)
[3 3 3 3]

df['Column B'] = df['Column A'] * (df.index.month - 8)
print (df)
                     Column A  Column B
2016-11-24 00:00:00       4.0      12.0
2016-11-24 01:00:00       7.8      23.4
2016-11-24 02:00:00      95.1     285.3
2016-11-24 03:00:00      78.4     235.2

您也可以使用 map by dict and then multiple by mul。在此解决方案中，有必要从 df.index.month 创建 Series，其中 return numpy array 的索引为 df（如果不是 index，则获取所有值 NaN 因为索引不匹配）。

d = {9:1,10:2,11:3,12:4}

df['Column B'] = pd.Series(df.index.month, index=df.index).map(d).mul(df['Column A'])
print (df)
                     Column A  Column B
2016-11-24 00:00:00       4.0      12.0
2016-11-24 01:00:00       7.8      23.4
2016-11-24 02:00:00      95.1     285.3
2016-11-24 03:00:00      78.4     235.2

Python/pandas 基于 date_time 索引值的条件语句

Python/pandas conditional statement based on date_time index values

python

conditional

datetime

pandas