Python, Pandas : Return 只有那些有缺失值的行
Python, Pandas : Return only those rows which have missing values
在 Pandas 工作期间 Python...
我正在处理一个包含一些缺失值的数据集,我想 return 一个只包含那些有缺失数据的行的数据框。有什么好的方法吗?
(我目前执行此操作的方法效率低下"look to see what index isn't in the dataframe without the missing values, then make a df out of those indices.")
您可以使用 any
axis=1
to check for least one True
per row, then filter with boolean indexing:
null_data = df[df.isnull().any(axis=1)]
如果您正在寻找一种更快的方法来查找数据框中缺失的行总数,您可以使用此方法:
sum(df.isnull().values.any(轴=1))
df.isnull().any(axis = 1).sum()
这会给出至少有一个缺失数据的总行数
我刚遇到这个问题我假设你想查看由我使用的缺失值的行组成的数据框部分
df.loc[df.isnull().any(axis=1)]
如果您只想查看包含 NaN 值的行,您可以这样做:
data_frame[data_frame.iloc[:, insert column number here]=='NaN']
你可以这样使用代码
sum(df.isnull().any(axis=1))
在 Pandas 工作期间 Python...
我正在处理一个包含一些缺失值的数据集,我想 return 一个只包含那些有缺失数据的行的数据框。有什么好的方法吗?
(我目前执行此操作的方法效率低下"look to see what index isn't in the dataframe without the missing values, then make a df out of those indices.")
您可以使用 any
axis=1
to check for least one True
per row, then filter with boolean indexing:
null_data = df[df.isnull().any(axis=1)]
如果您正在寻找一种更快的方法来查找数据框中缺失的行总数,您可以使用此方法:
sum(df.isnull().values.any(轴=1))
df.isnull().any(axis = 1).sum()
这会给出至少有一个缺失数据的总行数
我刚遇到这个问题我假设你想查看由我使用的缺失值的行组成的数据框部分
df.loc[df.isnull().any(axis=1)]
如果您只想查看包含 NaN 值的行,您可以这样做:
data_frame[data_frame.iloc[:, insert column number here]=='NaN']
你可以这样使用代码
sum(df.isnull().any(axis=1))