计算并知道哪些列在 Pandas 中有缺失值的替代方法

Question

我试过了，但我不确定这是否是获取有关包含缺失值的列的信息的最佳方式。例如，我使用目标标签来减少缺失值的信息，并更好地查看其分布

cols = dataframe.columns.values.tolist()
dfnas = pd.DataFrame()
for col in cols:
    dfnas[col] = dataframe.label[dataframe[col].isnull()].value_counts()

[已编辑]

这是该片段的结果

在[6]中：

dfnas 输出[6]:

输出[64]：

 id f1 f2 f3 f4 f5 f6

0 NaN NaN NaN 180 100 NaN NaN

1 NaN NaN NaN 1 1 NaN NaN

Answer 1

您可以使用 np.sum 获取每列的计数：

import numpy as np
import pandas as pd

df = pd.DataFrame({'c1':[1, np.nan, np.nan], 'c2':[2, 2, np.nan]})
np.sum(df.isnull())
Out[4]: 
c1    2
c2    1
dtype: int64

计算并知道哪些列在 Pandas 中有缺失值的替代方法

Alternatives to count and know what columns have missing values in Pandas

python

missing-data

pandas