从 pandas 数据框列中获取单词的频率
Getting frequency of words from a pandas dataframe column
我有一个数据框,其中包含演员表列,其中包含电影中的多个演员。如何计算每个演员在数据集中出现的次数
这是该列的一个片段
df['cast'][:3]
0 João Miguel, Bianca Comparato, Michel Gomes, R...
1 Demián Bichir, Héctor Bonilla, Oscar Serrano, ...
2 Tedd Chan, Stella Chung, Henley Hii, Lawrence ...
Name: cast, dtype: object
有人可以帮忙吗?
使用以下代码片段查找 'Stella Chung' 的计数,例如:
" ".join(df['cast'].values).count('Stella Chung')
更新:
以下是对所做工作的解释:
df['cast'].values
returns 包含来自名为 cast
. 的列的所有单独列值的数组
" ".join(array)
将数组中的所有字符串连接成一个大字符串
string.count(substring)
returns子字符串在主字符串中出现的次数。
我有一个数据框,其中包含演员表列,其中包含电影中的多个演员。如何计算每个演员在数据集中出现的次数 这是该列的一个片段
df['cast'][:3]
0 João Miguel, Bianca Comparato, Michel Gomes, R...
1 Demián Bichir, Héctor Bonilla, Oscar Serrano, ...
2 Tedd Chan, Stella Chung, Henley Hii, Lawrence ...
Name: cast, dtype: object
有人可以帮忙吗?
使用以下代码片段查找 'Stella Chung' 的计数,例如:
" ".join(df['cast'].values).count('Stella Chung')
更新:
以下是对所做工作的解释:
df['cast'].values
returns 包含来自名为cast
. 的列的所有单独列值的数组
" ".join(array)
将数组中的所有字符串连接成一个大字符串string.count(substring)
returns子字符串在主字符串中出现的次数。