pandas 数据框中按列的累计总和

Cumulative sum by column in pandas dataframe

我创建了以下数据框:

d = {'x': [0,0,1,1,1,1,1,2,2,2], 'y': [67,-5,78,47,88,12,-4,14,232,28]}
df = pd.DataFrame(data=d)
print(df)

看起来像这样:

我想计算列“z”,它是列“y”乘以列“x”的累加。所以,只要x是相同的值,我就计算累积分布。生成的数据框应如下所示:

因此,当 X 列更改值时,将计算新的累积分布。

我如何在 python 中做到这一点?

您可以使用 groupby + cumsum

每组执行 cumsum
df['z'] = df.groupby('x')['y'].cumsum()

输出:

   x    y    z
0  0   67   67
1  0   -5   62
2  1   78   78
3  1   47  125
4  1   88  213
5  1   12  225
6  1   -4  221
7  2   14   14
8  2  232  246
9  2   28  274

cumsum 是您要搜索的内容:

df['z'] = df.groupby('x')['y'].cumsum()