如何在 CSV 文件中找到 isnull() 值?
How can I find the isnull() value in CSV file?
In[17]: train_data.isnull()
Out[17]:
Category Title
0 False False
1 False False
2 False False
3 False False
4 False False
... ...
98013 False False
98014 False False
98015 False False
98016 False False
98017 False False
[98018 rows x 2 columns]
In [18]: print(train_data.isnull().sum())
Category 0
Title 1
dtype: int64
在train_data中,csv文件中有一个空值。
我需要找到一个空值并将其删除。
1.Use 从数据集中删除包含空值的行:train_data.dropna()
使用它来用任何值填充空值,例如 0:train_data.fillna(0)
如果您想知道哪一列包含空值,请尝试:
过滤掉None值:train_data[train_data["column_name"].notnull()]
- 如果您知道 NA 值在字段标题中
train_data.dropna(subset=['Title'])
- 如果要删除所有 NA
train_data.dropna()
- 查看带有 NA 的列
train_data.isna().any()
- 如果您想查看 NA 值
train_data[train_data.isna().any(axis=1)]
我发现 NaN 的类型是 float。
所以我用它。
for i in range(len(train_data)):
if type(train_data.Title[i]) == float:
print(i)
In[17]: train_data.isnull()
Out[17]:
Category Title
0 False False
1 False False
2 False False
3 False False
4 False False
... ...
98013 False False
98014 False False
98015 False False
98016 False False
98017 False False
[98018 rows x 2 columns]
In [18]: print(train_data.isnull().sum())
Category 0
Title 1
dtype: int64
在train_data中,csv文件中有一个空值。 我需要找到一个空值并将其删除。
1.Use 从数据集中删除包含空值的行:train_data.dropna()
使用它来用任何值填充空值,例如 0:
train_data.fillna(0)
如果您想知道哪一列包含空值,请尝试:
过滤掉None值:
train_data[train_data["column_name"].notnull()]
- 如果您知道 NA 值在字段标题中
train_data.dropna(subset=['Title'])
- 如果要删除所有 NA
train_data.dropna()
- 查看带有 NA 的列
train_data.isna().any()
- 如果您想查看 NA 值
train_data[train_data.isna().any(axis=1)]
我发现 NaN 的类型是 float。 所以我用它。
for i in range(len(train_data)):
if type(train_data.Title[i]) == float:
print(i)