根据多个条件从 pandas 数据框中删除带有 NaN 的行

Drop rows with NaNs from pandas dataframe based on multiple conditions

我有一个包含很多 NaN 的数据框。

y 列表示事件的计数,val 表示该年中每个事件的值,total 表示两列的乘积。

许多列有零,许多列有 NaN,因为 values 不可用(多达 80% 的数据丢失)是 4 列。

y17 y18 y19 y20 val17 va18 val19 val20 total17 total18 total19 total20
 1   2   1   2    2    2     2    2       1      4        2      4
 2   2   2   2    2    2     2    2       4      4        4      4
 3   3   3   3   NaN  NaN   NaN  NaN     NaN    NaN      NaN    NaN
 0   0   0   0    1    2     3    4       0      0        0      0
 0   0   0   0   NaN  NaN   NaN  NaN     NaN    NaN      NaN    NaN

我想保留 行所有值都带有零和数字 并且我想保留 前四列(多条件)有零的行.

预期输出

y17 y18 y19 y20 val17 va18 val19 val20 total17 total18 total19 total20
 1   2   1   2    2    2     2    2       1      4        2      4
 2   2   2   2    2    2     2    2       4      4        4      4
 0   0   0   0    1    2     3    4       0      0        0      0
 0   0   0   0   NaN  NaN   NaN  NaN     NaN    NaN      NaN    NaN

谢谢!

all

传递条件即可
out = df[df.iloc[:,:4].eq(0).all(1) | df.notna().all(1)]
Out[386]: 
   y17  y18  y19  y20  val17  ...  val20  total17  total18  total19  total20
0    1    2    1    2    2.0  ...    2.0      1.0      4.0      2.0      4.0
1    2    2    2    2    2.0  ...    2.0      4.0      4.0      4.0      4.0
3    0    0    0    0    1.0  ...    4.0      0.0      0.0      0.0      0.0
4    0    0    0    0    NaN  ...    NaN      NaN      NaN      NaN      NaN
[4 rows x 12 columns]