调用 pandas describe 函数时排除一个值
Excluding a value when calling pandas describe function
为了处理两列中的 NaN 值,我将它们替换为 0。然后,我 运行 pandas describe 函数,但我希望它排除 0 值。我怎样才能做到这一点?因为现在,它显示 0 值作为列的最小值。
df[df["Column_name"] != 0].describe()
或
data.dropna(inplace = True).describe()
我认为最直接的解决方案是保留 NaN
值并仅调用 describe。默认情况下,该函数将忽略 NaN
值来汇总数据,如 pandas documentation.
中所述
尝试将 data.dropna()
保存在新变量中,或者只复制不带 inplace
参数的结果。这是必要的,因为 data.dropna(inplace = True)
的 return 是 None
。您可以通过打印其结果来确认这一点:
print(data.dropna(inplace = True)) # prints "None"
解决方案
使用新数据框:
new_df = data.dropna(inplace = True)
new_df.describe()
没有新的数据框:
data.dropna().copy().describe()
为了处理两列中的 NaN 值,我将它们替换为 0。然后,我 运行 pandas describe 函数,但我希望它排除 0 值。我怎样才能做到这一点?因为现在,它显示 0 值作为列的最小值。
df[df["Column_name"] != 0].describe()
或
data.dropna(inplace = True).describe()
我认为最直接的解决方案是保留 NaN
值并仅调用 describe。默认情况下,该函数将忽略 NaN
值来汇总数据,如 pandas documentation.
尝试将 data.dropna()
保存在新变量中,或者只复制不带 inplace
参数的结果。这是必要的,因为 data.dropna(inplace = True)
的 return 是 None
。您可以通过打印其结果来确认这一点:
print(data.dropna(inplace = True)) # prints "None"
解决方案
使用新数据框:
new_df = data.dropna(inplace = True)
new_df.describe()
没有新的数据框:
data.dropna().copy().describe()