python 为什么wordcloud库不能用停用词屏蔽汉字
Why wordcloud libraries can't use stopwords to block Chinese characters in python
今天想用WordCloud做一个词云,但是最大的词是没有意义的,"的",比如英文的"is"。我想删除它,所以我创建了“停用词”来处理它,但它仍然存在。我试过很多方法,比如"stopwords = ["的"]","stopwords = {"的"},或者"stopwords = set(),stopword.update(["的"])等等。但是他们从不工作。我怀疑是wordcloud不支持中文还是我设置错了font_path。请帮助我,非常感谢。
这是主要代码
def draw_word(words_dict):
stopwords = {'的','是','了','说','地','得','在','与','和'}
wc = WordCloud(
#设定字体,否则无法支持中文输出
font_path="msyh.ttc",
background_color = "white",
#最大显示单词量,默认200
max_words=150,
width=1500,
height=960,
margin = 10,
#过滤掉高频无用助词
stopwords = stopwords
)
#从词频字典中导出词云
wc.generate_from_frequencies(words_dict)
#绘制图片
plt.imshow(wc)
#显示图片
plt.show()
和输出
最大的是我要删除的“的”。
stopwords
: set of strings or None
The words that will be
eliminated. If None
, the build-in STOPWORDS list will be used. Ignored
if using generate_from_frequencies
.
今天想用WordCloud做一个词云,但是最大的词是没有意义的,"的",比如英文的"is"。我想删除它,所以我创建了“停用词”来处理它,但它仍然存在。我试过很多方法,比如"stopwords = ["的"]","stopwords = {"的"},或者"stopwords = set(),stopword.update(["的"])等等。但是他们从不工作。我怀疑是wordcloud不支持中文还是我设置错了font_path。请帮助我,非常感谢。
这是主要代码
def draw_word(words_dict):
stopwords = {'的','是','了','说','地','得','在','与','和'}
wc = WordCloud(
#设定字体,否则无法支持中文输出
font_path="msyh.ttc",
background_color = "white",
#最大显示单词量,默认200
max_words=150,
width=1500,
height=960,
margin = 10,
#过滤掉高频无用助词
stopwords = stopwords
)
#从词频字典中导出词云
wc.generate_from_frequencies(words_dict)
#绘制图片
plt.imshow(wc)
#显示图片
plt.show()
和输出
最大的是我要删除的“的”。
stopwords
: set of strings orNone
The words that will be eliminated. IfNone
, the build-in STOPWORDS list will be used. Ignored if usinggenerate_from_frequencies
.