从 pandas 数据框列中获取单词的频率

Getting frequency of words from a pandas dataframe column

我有一个数据框,其中包含演员表列,其中包含电影中的多个演员。如何计算每个演员在数据集中出现的次数 这是该列的一个片段

df['cast'][:3]
0    João Miguel, Bianca Comparato, Michel Gomes, R...
1    Demián Bichir, Héctor Bonilla, Oscar Serrano, ...
2    Tedd Chan, Stella Chung, Henley Hii, Lawrence ...
Name: cast, dtype: object

有人可以帮忙吗?

使用以下代码片段查找 'Stella Chung' 的计数,例如:

" ".join(df['cast'].values).count('Stella Chung')

更新:

以下是对所做工作的解释:

  • df['cast'].values returns 包含来自名为 cast.
  • 的列的所有单独列值的数组
  • " ".join(array) 将数组中的所有字符串连接成一个大字符串
  • string.count(substring) returns子字符串在主字符串中出现的次数。