Pandas 将每列与前 4 行聚合
Pandas aggreagte each column with 4 previous rows
我有一个数据框:
df = Feat1 Feat2 Feat3
1 3 2
4 7 1
6 1 6
2 9 4
5 8 5
0 3 1
我想创建一个数据框,这样对于 t > 4 的每一行,每一列都是 t-1 + 0.75*t-2 + 0.5*t-3 + 0.25*t-4
所以对于这个 df 我将有:
df = Feat1 Feat2 Feat3
1 3 2
4 7 1
6 1 6
2 9 4
8.75 14 9.5
14.25 23 6.75
最好的方法是什么?
递归计算不可向量化,为提高性能使用 numba:
from numba import jit
@jit(nopython=True)
def f(d):
for t in range(4, d.shape[0]):
d[t] = d[t-1] + 0.75*d[t-2] + 0.5*d[t-3] + 0.25*d[t-4]
return d
df = pd.DataFrame(f(df.to_numpy().astype(float)), index=df.index, columns=df.columns)
print (df)
Feat1 Feat2 Feat3
0 1.00 3.0 2.00
1 4.00 7.0 1.00
2 6.00 1.0 6.00
3 2.00 9.0 4.00
4 8.75 14.0 9.50
5 14.25 23.0 15.75
我有一个数据框:
df = Feat1 Feat2 Feat3
1 3 2
4 7 1
6 1 6
2 9 4
5 8 5
0 3 1
我想创建一个数据框,这样对于 t > 4 的每一行,每一列都是 t-1 + 0.75*t-2 + 0.5*t-3 + 0.25*t-4
所以对于这个 df 我将有:
df = Feat1 Feat2 Feat3
1 3 2
4 7 1
6 1 6
2 9 4
8.75 14 9.5
14.25 23 6.75
最好的方法是什么?
递归计算不可向量化,为提高性能使用 numba:
from numba import jit
@jit(nopython=True)
def f(d):
for t in range(4, d.shape[0]):
d[t] = d[t-1] + 0.75*d[t-2] + 0.5*d[t-3] + 0.25*d[t-4]
return d
df = pd.DataFrame(f(df.to_numpy().astype(float)), index=df.index, columns=df.columns)
print (df)
Feat1 Feat2 Feat3
0 1.00 3.0 2.00
1 4.00 7.0 1.00
2 6.00 1.0 6.00
3 2.00 9.0 4.00
4 8.75 14.0 9.50
5 14.25 23.0 15.75