计算并知道哪些列在 Pandas 中有缺失值的替代方法
Alternatives to count and know what columns have missing values in Pandas
我试过了,但我不确定这是否是获取有关包含缺失值的列的信息的最佳方式。例如,我使用目标标签来减少缺失值的信息,并更好地查看其分布
cols = dataframe.columns.values.tolist()
dfnas = pd.DataFrame()
for col in cols:
dfnas[col] = dataframe.label[dataframe[col].isnull()].value_counts()
[已编辑]
这是该片段的结果
在[6]中:
dfnas
输出[6]:
输出[64]:
id f1 f2 f3 f4 f5 f6
0 NaN NaN NaN 180 100 NaN NaN
1 NaN NaN NaN 1 1 NaN NaN
您可以使用 np.sum
获取每列的计数:
import numpy as np
import pandas as pd
df = pd.DataFrame({'c1':[1, np.nan, np.nan], 'c2':[2, 2, np.nan]})
np.sum(df.isnull())
Out[4]:
c1 2
c2 1
dtype: int64
我试过了,但我不确定这是否是获取有关包含缺失值的列的信息的最佳方式。例如,我使用目标标签来减少缺失值的信息,并更好地查看其分布
cols = dataframe.columns.values.tolist()
dfnas = pd.DataFrame()
for col in cols:
dfnas[col] = dataframe.label[dataframe[col].isnull()].value_counts()
[已编辑]
这是该片段的结果
在[6]中:
dfnas 输出[6]:
输出[64]:
id f1 f2 f3 f4 f5 f6
0 NaN NaN NaN 180 100 NaN NaN
1 NaN NaN NaN 1 1 NaN NaN
您可以使用 np.sum
获取每列的计数:
import numpy as np
import pandas as pd
df = pd.DataFrame({'c1':[1, np.nan, np.nan], 'c2':[2, 2, np.nan]})
np.sum(df.isnull())
Out[4]:
c1 2
c2 1
dtype: int64