如何识别 pandas 数据框中的非空列?
How to identity non-empty columns in pandas dataframe?
我正在处理一个包含大约 2000 列的数据集,我注意到其中很多是空的。我想具体知道其中有多少是空的,有多少不是。我使用以下代码:
df.isnull().sum()
我会得到每一列中的空行数。但是,鉴于我正在调查大约 2000 列和 7593 行,IPython 中的输出如下所示:
FEMALE_DEATH_YR3_RT 7593
FEMALE_COMP_ORIG_YR3_RT 7593
PELL_COMP_4YR_TRANS_YR3_RT 7593
PELL_COMP_2YR_TRANS_YR3_RT 7593
...
FIRSTGEN_YR4_N 7593
NOT1STGEN_YR4_N 7593
它没有显示所有的列,因为它有太多的列。因此,很难判断有多少列都是空的,有多少列不是。
我想知道有没有办法让我快速识别非空列?谢谢!
to find the number of non empty columns:
len(df.columns) - len(df.dropna(axis=1,how='all').columns)
3
df
Country movie name rating year Something
0 thg John 3 NaN NaN NaN
1 thg Jan 4 NaN NaN NaN
2 mol Graham lob NaN NaN NaN
df=df.dropna(axis=1,how='all')
Country movie name
0 thg John 3
1 thg Jan 4
2 mol Graham lob
我正在处理一个包含大约 2000 列的数据集,我注意到其中很多是空的。我想具体知道其中有多少是空的,有多少不是。我使用以下代码:
df.isnull().sum()
我会得到每一列中的空行数。但是,鉴于我正在调查大约 2000 列和 7593 行,IPython 中的输出如下所示:
FEMALE_DEATH_YR3_RT 7593
FEMALE_COMP_ORIG_YR3_RT 7593
PELL_COMP_4YR_TRANS_YR3_RT 7593
PELL_COMP_2YR_TRANS_YR3_RT 7593
...
FIRSTGEN_YR4_N 7593
NOT1STGEN_YR4_N 7593
它没有显示所有的列,因为它有太多的列。因此,很难判断有多少列都是空的,有多少列不是。 我想知道有没有办法让我快速识别非空列?谢谢!
to find the number of non empty columns:
len(df.columns) - len(df.dropna(axis=1,how='all').columns)
3
df
Country movie name rating year Something
0 thg John 3 NaN NaN NaN
1 thg Jan 4 NaN NaN NaN
2 mol Graham lob NaN NaN NaN
df=df.dropna(axis=1,how='all')
Country movie name
0 thg John 3
1 thg Jan 4
2 mol Graham lob