如何使用 Python 根据当前值填充缺失值?
How to fill missing values based on the current values using Python?
我的数据是这样的:
a=pd.DataFrame({'id':[0,1,2,3,4,5,6,7,8,9],
'value':[np.nan,np.nan,0,np.nan,np.nan,1,2,np.nan,3,np.nan]})
我想根据之前已知的值来填补缺失值。如果没有以前的值,则填充-1。所以,结果应该是这样的:
id value
0 -1
1 -1
2 0
3 0
4 0
5 1
6 2
7 2
8 3
9 3
我现在的做法是找到所有已知值及其位置,然后全盘扫描table。但是应该有一种我不知道的更好的方法。我可以在这里尝试什么?
你需要一个ffill
和一个fillna
a['value'] = a.value.ffill().fillna(-1)
Out[935]:
id value
0 0 -1.0
1 1 -1.0
2 2 0.0
3 3 0.0
4 4 0.0
5 5 1.0
6 6 2.0
7 7 2.0
8 8 3.0
9 9 3.0
使用df.ffill()
和fillna()
:
In [1587]: a.ffill().fillna(-1)
Out[1587]:
id value
0 0 -1.0
1 1 -1.0
2 2 0.0
3 3 0.0
4 4 0.0
5 5 1.0
6 6 2.0
7 7 2.0
8 8 3.0
9 9 3.0
我的数据是这样的:
a=pd.DataFrame({'id':[0,1,2,3,4,5,6,7,8,9],
'value':[np.nan,np.nan,0,np.nan,np.nan,1,2,np.nan,3,np.nan]})
我想根据之前已知的值来填补缺失值。如果没有以前的值,则填充-1。所以,结果应该是这样的:
id value
0 -1
1 -1
2 0
3 0
4 0
5 1
6 2
7 2
8 3
9 3
我现在的做法是找到所有已知值及其位置,然后全盘扫描table。但是应该有一种我不知道的更好的方法。我可以在这里尝试什么?
你需要一个ffill
和一个fillna
a['value'] = a.value.ffill().fillna(-1)
Out[935]:
id value
0 0 -1.0
1 1 -1.0
2 2 0.0
3 3 0.0
4 4 0.0
5 5 1.0
6 6 2.0
7 7 2.0
8 8 3.0
9 9 3.0
使用df.ffill()
和fillna()
:
In [1587]: a.ffill().fillna(-1)
Out[1587]:
id value
0 0 -1.0
1 1 -1.0
2 2 0.0
3 3 0.0
4 4 0.0
5 5 1.0
6 6 2.0
7 7 2.0
8 8 3.0
9 9 3.0