尝试过滤掉 pandas 数据框中的唯一值

Trying to filter out unique values in a pandas data frame

您好,有没有办法过滤掉 pandas 数据框中的唯一值。 我正在使用下面的代码来过滤掉唯一值。但是,我得到了不同的有序组合。例如,['Creative, Modern Cuisine'、'Modern Cuisine, Creative'] 有没有办法过滤掉它。

[]

cuisine = df.Cuisine.unique()
cuisine_count = df.Cuisine.nunique()
print(cuisine, cuisine_count)

如果我理解你的意图,你正在尝试获取出现在你的 DataFrame 中的所有不同美食的列表。试试这个:

df['Cuisine'].str.split(',').explode().str.strip().unique().tolist()

解释:

  • df['Cuisine'].str.split(','):在逗号处拆分 Cuisine 字符串,生成一个系列,每行有一个 Python 列表,其中每个列表项包含一个单独的美食字符串
  • .explode():对于每个美食字符串列表,将每个字符串转换为一行
  • .str.strip(): 去除空白
  • .unique().tolist(): 获取独特美食列表