调用 pandas describe 函数时排除一个值

Question

为了处理两列中的 NaN 值，我将它们替换为 0。然后，我运行 pandas describe 函数，但我希望它排除 0 值。我怎样才能做到这一点？因为现在，它显示 0 值作为列的最小值。

Answer 1

df[df["Column_name"] != 0].describe()

或

data.dropna(inplace = True).describe()

Answer 2

我认为最直接的解决方案是保留 NaN 值并仅调用 describe。默认情况下，该函数将忽略 NaN 值来汇总数据，如 pandas documentation.

中所述

尝试将 data.dropna() 保存在新变量中，或者只复制不带 inplace 参数的结果。这是必要的，因为 data.dropna(inplace = True) 的 return 是 None。您可以通过打印其结果来确认这一点：

print(data.dropna(inplace = True))  # prints "None"

解决方案

使用新数据框：

new_df = data.dropna(inplace = True)
new_df.describe()

没有新的数据框：

data.dropna().copy().describe()

Excluding a value when calling pandas describe function