尝试过滤掉 pandas 数据框中的唯一值
Trying to filter out unique values in a pandas data frame
您好,有没有办法过滤掉 pandas 数据框中的唯一值。
我正在使用下面的代码来过滤掉唯一值。但是,我得到了不同的有序组合。例如,['Creative, Modern Cuisine'、'Modern Cuisine, Creative'] 有没有办法过滤掉它。
[]
cuisine = df.Cuisine.unique()
cuisine_count = df.Cuisine.nunique()
print(cuisine, cuisine_count)
如果我理解你的意图,你正在尝试获取出现在你的 DataFrame 中的所有不同美食的列表。试试这个:
df['Cuisine'].str.split(',').explode().str.strip().unique().tolist()
解释:
df['Cuisine'].str.split(',')
:在逗号处拆分 Cuisine
字符串,生成一个系列,每行有一个 Python 列表,其中每个列表项包含一个单独的美食字符串
.explode()
:对于每个美食字符串列表,将每个字符串转换为一行
.str.strip()
: 去除空白
.unique().tolist()
: 获取独特美食列表
您好,有没有办法过滤掉 pandas 数据框中的唯一值。 我正在使用下面的代码来过滤掉唯一值。但是,我得到了不同的有序组合。例如,['Creative, Modern Cuisine'、'Modern Cuisine, Creative'] 有没有办法过滤掉它。
[
cuisine = df.Cuisine.unique()
cuisine_count = df.Cuisine.nunique()
print(cuisine, cuisine_count)
如果我理解你的意图,你正在尝试获取出现在你的 DataFrame 中的所有不同美食的列表。试试这个:
df['Cuisine'].str.split(',').explode().str.strip().unique().tolist()
解释:
df['Cuisine'].str.split(',')
:在逗号处拆分Cuisine
字符串,生成一个系列,每行有一个 Python 列表,其中每个列表项包含一个单独的美食字符串.explode()
:对于每个美食字符串列表,将每个字符串转换为一行.str.strip()
: 去除空白.unique().tolist()
: 获取独特美食列表