Pandas - 根据列中的先前值设置值
Pandas - Setting value based on previous values in column
我有一个包含降雨数据的数据集。我想使用 Pandas.
设置一个 运行 蓄雨器
这是我的:
def determinePrev(df):
#NEED TO CHANGE VALUE TO RUNNING VVVVVV#
df.loc[df['Rain'] > 0, 'Running']=df['Rain'].shift(1)+df['Rain']
return df
运行好像可以,但是只有连续两天下雨才合适。当用 'Running' 替换后面的“Rain”之一时,我得到 KeyError: 'Running'.
我一直在努力寻找解决方案,但感觉我一无所获。我是 Python 的新手,所以如果您有解决方案,能否提供尽可能详细的信息?
谢谢!
编辑:我应该补充一点,我不想计算连续的天数,而是测量连续下雨天的降雨量。
编辑#2:
使用 Series.eq
and Series.cumsum
to calculate the cumalative series c
which is used to groups the consecutive rainy days, then use Series.groupby
对这个系列的 Rain
列进行分组,并使用转换函数 cumsum
:
c = df['Rain'].eq(0).cumsum()
df['Running'] = df['Rain'].groupby(c).cumsum()
结果:
# print(df)
Rain Running
0 0.0 0.0
1 0.8 0.8
2 2.4 3.2
3 19.4 22.6
4 6.2 28.8
5 1.0 29.8
6 0.0 0.0
我有一个包含降雨数据的数据集。我想使用 Pandas.
设置一个 运行 蓄雨器这是我的:
def determinePrev(df):
#NEED TO CHANGE VALUE TO RUNNING VVVVVV#
df.loc[df['Rain'] > 0, 'Running']=df['Rain'].shift(1)+df['Rain']
return df
运行好像可以,但是只有连续两天下雨才合适。当用 'Running' 替换后面的“Rain”之一时,我得到 KeyError: 'Running'.
我一直在努力寻找解决方案,但感觉我一无所获。我是 Python 的新手,所以如果您有解决方案,能否提供尽可能详细的信息?
谢谢!
编辑:我应该补充一点,我不想计算连续的天数,而是测量连续下雨天的降雨量。
编辑#2:
使用 Series.eq
and Series.cumsum
to calculate the cumalative series c
which is used to groups the consecutive rainy days, then use Series.groupby
对这个系列的 Rain
列进行分组,并使用转换函数 cumsum
:
c = df['Rain'].eq(0).cumsum()
df['Running'] = df['Rain'].groupby(c).cumsum()
结果:
# print(df)
Rain Running
0 0.0 0.0
1 0.8 0.8
2 2.4 3.2
3 19.4 22.6
4 6.2 28.8
5 1.0 29.8
6 0.0 0.0