如何从 35000 行中删除 4 个不同列中包含 NaN 的行中的 20 行?
How to drop only 20 rows out od 35000 that contain NaN in 4 different columns?
我需要帮助。我正在尝试使用 pandas
清理一个非常大的数据框。我有 35064 行和 16 columns.In 20 行我在 4 列中有 np.nan
,所以我想删除这 20 行。我想用 0 替换 np.nan
,然后在这 4 列的每个 od 中查找值为 0
的索引
(indexes_to_drop=df.loc[df['temp']==0].index
然后做
df.drop(indexes_to_drop,axis=0,inplace=True)
但是我忘了这个列包含常规的 0,我不能删除它
我还想添加 for 循环,因为我有 4 列。
谢谢
为什么不用这个?
df = df.dropna()
如果有其他列包含 NaN 但您不想根据它们的值删除行:
df_clean = df.dropna(subset=[column1, column2, column3, column4])
这将只考虑您担心的 4 列,并仅根据它们删除行。
编辑:为了清晰、语法和遗漏的单词。
我需要帮助。我正在尝试使用 pandas
清理一个非常大的数据框。我有 35064 行和 16 columns.In 20 行我在 4 列中有 np.nan
,所以我想删除这 20 行。我想用 0 替换 np.nan
,然后在这 4 列的每个 od 中查找值为 0
(indexes_to_drop=df.loc[df['temp']==0].index
然后做
df.drop(indexes_to_drop,axis=0,inplace=True)
但是我忘了这个列包含常规的 0,我不能删除它 我还想添加 for 循环,因为我有 4 列。 谢谢
为什么不用这个?
df = df.dropna()
如果有其他列包含 NaN 但您不想根据它们的值删除行:
df_clean = df.dropna(subset=[column1, column2, column3, column4])
这将只考虑您担心的 4 列,并仅根据它们删除行。
编辑:为了清晰、语法和遗漏的单词。