pandas 数据框的一列中缺少数据
Missing data in a column of pandas dataframe
我正在创建一个数据框名称 "salesdata",它有一个列名称 "Outlet_Size",此列包含一些缺失的内容 data.This 是我的代码-:
#defining a dictionary
cat_dict ={}
#getting all the values of the column
outlet_size_values = salesdata.Outlet_Size.values
unique_outlet_size_val = list(set(outlet_size_values))
print(unique_outlet_size_val)
我得到的输出是
[南,'High','Medium','Small']
我不希望这个丢失的数据 (nan) 成为我列表的一部分,我不想为此创建一个新列表。
pandas
具有函数 unique 来获取不同的值。您可以使用它并过滤掉像
这样的 NaN
salesdata.loc[~salesdata.Outlet_Size.isnull(), 'Outlet_Size'].unique()
使用基本的 pandas 函数:dropna
删除 nan 值,然后 unique
得到 set-equivalent 结果:
salesdata.Outlet_Size.dropna().unique()
您可以使用numpy.unique
import pandas as pd
import numpy as np
np.unique(salesdata.Outlet_Size.dropna().values)
我正在创建一个数据框名称 "salesdata",它有一个列名称 "Outlet_Size",此列包含一些缺失的内容 data.This 是我的代码-:
#defining a dictionary
cat_dict ={}
#getting all the values of the column
outlet_size_values = salesdata.Outlet_Size.values
unique_outlet_size_val = list(set(outlet_size_values))
print(unique_outlet_size_val)
我得到的输出是 [南,'High','Medium','Small'] 我不希望这个丢失的数据 (nan) 成为我列表的一部分,我不想为此创建一个新列表。
pandas
具有函数 unique 来获取不同的值。您可以使用它并过滤掉像
salesdata.loc[~salesdata.Outlet_Size.isnull(), 'Outlet_Size'].unique()
使用基本的 pandas 函数:dropna
删除 nan 值,然后 unique
得到 set-equivalent 结果:
salesdata.Outlet_Size.dropna().unique()
您可以使用numpy.unique
import pandas as pd
import numpy as np
np.unique(salesdata.Outlet_Size.dropna().values)