Pandas 将每列与前 4 行聚合

Question

我有一个数据框：

df = Feat1  Feat2   Feat3
     1        3       2
     4        7       1
     6        1       6
     2        9       4
     5        8       5
     0        3       1

我想创建一个数据框，这样对于 t > 4 的每一行，每一列都是 t-1 + 0.75*t-2 + 0.5*t-3 + 0.25*t-4

所以对于这个 df 我将有：

df = Feat1  Feat2   Feat3
     1        3       2
     4        7       1
     6        1       6
     2        9       4
    8.75      14      9.5
   14.25      23      6.75

最好的方法是什么？

Answer 1

递归计算不可向量化，为提高性能使用 numba:

from numba import jit

@jit(nopython=True)
def f(d):
    for t in range(4, d.shape[0]):
        d[t] = d[t-1] + 0.75*d[t-2] + 0.5*d[t-3] + 0.25*d[t-4]
    return d

df = pd.DataFrame(f(df.to_numpy().astype(float)), index=df.index, columns=df.columns)
print (df)
   Feat1  Feat2  Feat3
0   1.00    3.0   2.00
1   4.00    7.0   1.00
2   6.00    1.0   6.00
3   2.00    9.0   4.00
4   8.75   14.0   9.50
5  14.25   23.0  15.75

Pandas 将每列与前 4 行聚合

Pandas aggreagte each column with 4 previous rows

python

dataframe

pandas

data-munging