我如何根据参考 csv 文件填写缺失的 csv 文件值
How can i fill in missing csv file value base on reference csv file
我有这样的参考文件
Id, Value1, Value2
a, a1, a2
b, b1, b2
c, c1, c2
d, d1, d2
...
n, n1, n2
和丢失的文件
Id, Value1, Value2
d, , d2
g, , g2
a, a1 ,
c, c1 ,
...
n, , n2
如何根据参考文件编写代码来填充缺失值'Id'
您可以使用 fillna() 来做到这一点,但首先将您的连接列设置为两个 DF 中的索引:
In [71]: df = df.set_index('Id').fillna(ref.set_index('Id')).reset_index()
In [72]: df
Out[72]:
Id Value1 Value2
0 d d1 d2
1 g NaN g2
2 a a1 a2
3 c c1 c2
数据:
In [69]: ref
Out[69]:
Id Value1 Value2
0 a a1 a2
1 b b1 b2
2 c c1 c2
3 d d1 d2
In [70]: df
Out[70]:
Id Value1 Value2
0 d NaN d2
1 g NaN g2
2 a a1 NaN
3 c c1 NaN
我有这样的参考文件
Id, Value1, Value2
a, a1, a2
b, b1, b2
c, c1, c2
d, d1, d2
...
n, n1, n2
和丢失的文件
Id, Value1, Value2
d, , d2
g, , g2
a, a1 ,
c, c1 ,
...
n, , n2
如何根据参考文件编写代码来填充缺失值'Id'
您可以使用 fillna() 来做到这一点,但首先将您的连接列设置为两个 DF 中的索引:
In [71]: df = df.set_index('Id').fillna(ref.set_index('Id')).reset_index()
In [72]: df
Out[72]:
Id Value1 Value2
0 d d1 d2
1 g NaN g2
2 a a1 a2
3 c c1 c2
数据:
In [69]: ref
Out[69]:
Id Value1 Value2
0 a a1 a2
1 b b1 b2
2 c c1 c2
3 d d1 d2
In [70]: df
Out[70]:
Id Value1 Value2
0 d NaN d2
1 g NaN g2
2 a a1 NaN
3 c c1 NaN