我正在对 https://www.kaggle.com/snap/amazon-fine-food-reviews 数据集进行情绪分析

I'm performing sentiment analysis on https://www.kaggle.com/snap/amazon-fine-food-reviews dataset

我想为最常用的词创建词云。

import nltk 
from nltk.corpus import stopwords 
stopwords = set(STOPWORDS)
stopwords.update(["br", "href"])
textt = " ".join(review for review in df.Text)
wordcloud = WordCloud(stopwords=stopwords).generate(textt)
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")
plt.savefig('wordcloud11.png')
plt.show() 

我尝试使用此代码获取它,但出现错误 NameError: 名称 'STOPWORDS' 未定义 任何人都可以帮我解决这个问题。

您尚未定义 STOPWORDSWordCloud。您需要先导入或定义它们。您可以通过导入它们来使用 wordcloud 包中定义的那些。这是您需要的完整代码。我删除了 import nltk 声明,因为您没有使用它。另外我假设你已经有一个 pandas 数据帧 df 定义了一个 Text 字段。

from wordcloud import WordCloud, STOPWORDS
import matplotlib.pyplot as plt

stopwords = set(STOPWORDS)
stopwords.update(["br", "href"])
textt = " ".join(review for review in df.Text)
wordcloud = WordCloud(stopwords=stopwords).generate(textt)
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")
plt.savefig('wordcloud11.png')
plt.show()