Python: 来自 WordCloud 的字数统计

Python: word count from WordCloud

我正在文本正文中使用 WordCloud,我想查看云中每个单词的实际计数。我可以使用 .words_ 查看加权频率,但我想知道是否有一种简单的方法来查看实际计数?

# Generate a word cloud image
wordcloud = WordCloud(background_color="white").generate(text)
wordfreq = wordcloud.words_

编辑:我希望能够从 WordCloud 中查看字数(而不是自己从文本中查找字数)的原因是 WordCloud 在其分析中包括短语(搭配)和单个词.因此,例如,"water resources" 的计数以及未出现在 "water resources." 中的单词 "water" 的计数 WordCloud 似乎也会添加出现的单词实例以复数形式计算单词作为单数的数量(例如,在 "water resource" 中计算 "water resources")。

只需使用WordCloud().process_text(text):

>>> WordCloud().process_text('penn penn penn penn penn state state state state uni uni uni college college university states vice president vice president vice president vice president vice president vice president vice president')
{'penn': 5, 'state': 5, 'uni': 3, 'college': 2, 'university': 1, 'vice president': 7}

请注意,它将 "states" 合并到 "state" 计数中,并且还将 "vice president" 计数为二元语法。