Python、pandas 个数据帧。 pd.fillna() 用于具有特定值的特定列
Python, pandas dataframes. pd.fillna() for specific columns with specific values
例如这样的数据框:
| 1 6 nan ... |
| 1 nan 5 ... |
|nan 2 4 ... |
|... ... ... ....
我想使用列表 [11, 12, 13 ...]
中的值来用列表中的值填充 nan。因此,第一列的 nans 为 10,第二列为 12,依此类推。
有没有办法在不使用 .hstack()
和 df[column].fillna(value)
的情况下做到这一点?
解决方案
from itertools import cycle
import pandas as pd
c = cycle([11, 12, 13])
df.applymap(lambda x: next(c) if pd.isnull(x) else x)
循环函数 returns 可以从中获取下一个值的对象。然后使用 applymap
访问 DataFrame
的每个单元格。如果为空,则填充循环中的下一项。
您可以将 Series
传递给 DataFrame.fillna
; DataFrame 的列与 Series
:
的索引对齐
import numpy as np
import pandas as pd
nan = np.nan
df = pd.DataFrame({'A':[1,1,nan],'B':[6,nan,2],'C':[nan,5,4]})
ser = pd.Series([11,12,13], index=list('ABC'))
print(df.fillna(ser))
产量
A B C
0 1.0 6.0 13.0
1 1.0 12.0 5.0
2 11.0 2.0 4.0
例如这样的数据框:
| 1 6 nan ... |
| 1 nan 5 ... |
|nan 2 4 ... |
|... ... ... ....
我想使用列表 [11, 12, 13 ...]
中的值来用列表中的值填充 nan。因此,第一列的 nans 为 10,第二列为 12,依此类推。
有没有办法在不使用 .hstack()
和 df[column].fillna(value)
的情况下做到这一点?
解决方案
from itertools import cycle
import pandas as pd
c = cycle([11, 12, 13])
df.applymap(lambda x: next(c) if pd.isnull(x) else x)
循环函数 returns 可以从中获取下一个值的对象。然后使用 applymap
访问 DataFrame
的每个单元格。如果为空,则填充循环中的下一项。
您可以将 Series
传递给 DataFrame.fillna
; DataFrame 的列与 Series
:
import numpy as np
import pandas as pd
nan = np.nan
df = pd.DataFrame({'A':[1,1,nan],'B':[6,nan,2],'C':[nan,5,4]})
ser = pd.Series([11,12,13], index=list('ABC'))
print(df.fillna(ser))
产量
A B C
0 1.0 6.0 13.0
1 1.0 12.0 5.0
2 11.0 2.0 4.0