如何在 wordcloud 中取消 'Jesu' 以获得 'Jesus'?
How to un-stem 'Jesu' to get 'Jesus' in wordcloud?
尝试使用 wordcloud 从一本关于圣经的书中获取 .png 图像。 'Jesus' 这个词的词干是 'Jesu'。有没有办法单独给这个词一个例外?奇怪的是,'Moses' 没有词干。
{file_content = open("Wheres_Heaven.txt").read()}
{wordcloud = WordCloud(stopwords=None, background_color = 'white', width=1200, height=1000, max_words = 500, ).generate(file_content)}
{plt.figure( figsize=(20,10) )
{plt.imshow(wordcloud)}
{plt.axis('off')}
{plt.savefig('Heaven.png')}
{plt.show()}
Heaven.png
如果您有版本 1.8.1,那么您可以将“Jesu”放入停用词中。
逻辑是,当它在文本中同时看到“Jesu”和“Jesus”时,代码会假定它是复数形式。显然文本中没有“摩西”,这就是为什么不将其视为复数的原因。
尝试使用 wordcloud 从一本关于圣经的书中获取 .png 图像。 'Jesus' 这个词的词干是 'Jesu'。有没有办法单独给这个词一个例外?奇怪的是,'Moses' 没有词干。
{file_content = open("Wheres_Heaven.txt").read()}
{wordcloud = WordCloud(stopwords=None, background_color = 'white', width=1200, height=1000, max_words = 500, ).generate(file_content)}
{plt.figure( figsize=(20,10) )
{plt.imshow(wordcloud)}
{plt.axis('off')}
{plt.savefig('Heaven.png')}
{plt.show()}
Heaven.png
如果您有版本 1.8.1,那么您可以将“Jesu”放入停用词中。
逻辑是,当它在文本中同时看到“Jesu”和“Jesus”时,代码会假定它是复数形式。显然文本中没有“摩西”,这就是为什么不将其视为复数的原因。