pandas 数据框的一列中缺少数据

Missing data in a column of pandas dataframe

我正在创建一个数据框名称 "salesdata",它有一个列名称 "Outlet_Size",此列包含一些缺失的内容 data.This 是我的代码-:

#defining a dictionary
cat_dict ={}
#getting all the values of the column
outlet_size_values = salesdata.Outlet_Size.values
unique_outlet_size_val = list(set(outlet_size_values))  
print(unique_outlet_size_val)

我得到的输出是 [南,'High','Medium','Small'] 我不希望这个丢失的数据 (nan) 成为我列表的一部分,我不想为此创建一个新列表。

pandas 具有函数 unique 来获取不同的值。您可以使用它并过滤掉像

这样的 NaN
salesdata.loc[~salesdata.Outlet_Size.isnull(), 'Outlet_Size'].unique()

使用基本的 pandas 函数:dropna 删除 nan 值,然后 unique 得到 set-equivalent 结果:

salesdata.Outlet_Size.dropna().unique()

您可以使用numpy.unique

import pandas as pd
import numpy as np

np.unique(salesdata.Outlet_Size.dropna().values)