Pandas Series.isnull() 用于自定义 "NA" 定义
Pandas Series.isnull() for custom "NA" definition
我是 pandas 的新手,试图识别数据集中的缺失值(table 中的单元格)。
这是代码示例:
total = DataFrame.isnull().sum().sort_values(ascending=False)
但问题是我没有 "NA" 或 " " 值为空,在我的情况下值为 "undefined" 所以它算作不为空。
DataFrame 字符串示例:
id name country age sex phone
41113 Ann US undefined female undefined
如何修改 isnull()
或者有更好的方法吗?
您可以使用 ne
和 all
:
df[df.ne("undefined").all(axis=1)]
我是 pandas 的新手,试图识别数据集中的缺失值(table 中的单元格)。
这是代码示例:
total = DataFrame.isnull().sum().sort_values(ascending=False)
但问题是我没有 "NA" 或 " " 值为空,在我的情况下值为 "undefined" 所以它算作不为空。
DataFrame 字符串示例:
id name country age sex phone
41113 Ann US undefined female undefined
如何修改 isnull()
或者有更好的方法吗?
您可以使用 ne
和 all
:
df[df.ne("undefined").all(axis=1)]