根据上一行的内容向行添加新值
Add new value to row based on content of previous row
我希望完成我认为是一项简单的任务。我有一个大型数据集,它是在 python 中的各种 if 条件下创建的。如:
for index, row in df.iterrows():
if int(row['Fog_Event']) >= 4:
df.at[index, 'Fog_Event_determine'] = 'Fog'
elif int(row['Fog_Event']) == 3:
df.at[index, 'Fog_Event_determine'] = 'Dust'
elif int(row['Fog_Event']) == 2:
df.at[index, 'Fog_Event_determine'] = 'Dust'
else:
df.at[index, 'Fog_Event_determine'] = 'Background'
continue
这些工作完美地完成了我希望他们做的事情,但数据的最终分析存在一些问题。要解决此问题,我需要添加一个基于前一行结果的 运行 阈值。因此,如果第 1 行 >=4: 那么我希望第 2 行为 +1。
我试过这个:
df['Running_threshold'] = 0
for index, row in df.iterrows():
if int(row['Fog_Event']) >= 4:
df.loc[index[+1], 'Running_threshold'] = 1
else:
continue
但这只是将索引的第二行加了一个 1,这在查看时是有道理的。在满足条件 ['Fog_Event']) >= 4 后,如何要求 python 为每一行添加 +1?
谢谢。
- 使用
np.where()
执行 if 逻辑,因为它比循环更有效
- 首先根据前一行条件Running_threshold设置为零或一
cumsum()
总计 运行 如您所述
df = pd.DataFrame({"Fog_Event":np.random.randint(0, 10,20)})
df = df.assign(Fog_Event_Determine=np.where(df.Fog_Event>=4, "fog", np.where(df.Fog_Event>=2, "dust", "background"))
, Running_threshold=np.where(df.Fog_Event.shift()>=4,1,0)
).assign(Running_threshold=lambda dfa: dfa.Running_threshold.cumsum())
输出
Fog_Event Fog_Event_Determine Running_threshold
9 fog 0
3 dust 1
2 dust 1
9 fog 1
7 fog 2
0 background 3
4 fog 3
7 fog 4
6 fog 5
9 fog 6
1 background 7
6 fog 7
7 fog 8
8 fog 9
6 fog 10
9 fog 11
6 fog 12
2 dust 13
7 fog 13
8 fog 14
我希望完成我认为是一项简单的任务。我有一个大型数据集,它是在 python 中的各种 if 条件下创建的。如:
for index, row in df.iterrows():
if int(row['Fog_Event']) >= 4:
df.at[index, 'Fog_Event_determine'] = 'Fog'
elif int(row['Fog_Event']) == 3:
df.at[index, 'Fog_Event_determine'] = 'Dust'
elif int(row['Fog_Event']) == 2:
df.at[index, 'Fog_Event_determine'] = 'Dust'
else:
df.at[index, 'Fog_Event_determine'] = 'Background'
continue
这些工作完美地完成了我希望他们做的事情,但数据的最终分析存在一些问题。要解决此问题,我需要添加一个基于前一行结果的 运行 阈值。因此,如果第 1 行 >=4: 那么我希望第 2 行为 +1。
我试过这个:
df['Running_threshold'] = 0
for index, row in df.iterrows():
if int(row['Fog_Event']) >= 4:
df.loc[index[+1], 'Running_threshold'] = 1
else:
continue
但这只是将索引的第二行加了一个 1,这在查看时是有道理的。在满足条件 ['Fog_Event']) >= 4 后,如何要求 python 为每一行添加 +1?
谢谢。
- 使用
np.where()
执行 if 逻辑,因为它比循环更有效 - 首先根据前一行条件Running_threshold设置为零或一
cumsum()
总计 运行 如您所述
df = pd.DataFrame({"Fog_Event":np.random.randint(0, 10,20)})
df = df.assign(Fog_Event_Determine=np.where(df.Fog_Event>=4, "fog", np.where(df.Fog_Event>=2, "dust", "background"))
, Running_threshold=np.where(df.Fog_Event.shift()>=4,1,0)
).assign(Running_threshold=lambda dfa: dfa.Running_threshold.cumsum())
输出
Fog_Event Fog_Event_Determine Running_threshold
9 fog 0
3 dust 1
2 dust 1
9 fog 1
7 fog 2
0 background 3
4 fog 3
7 fog 4
6 fog 5
9 fog 6
1 background 7
6 fog 7
7 fog 8
8 fog 9
6 fog 10
9 fog 11
6 fog 12
2 dust 13
7 fog 13
8 fog 14