R:使用 TermDocumentMatrix 保持大写

R: Keep Upper Case with TermDocumentMatrix

我想用 wordcloud 包创建一个词云。我的问题是我想在单词的开头保留大写字母,但所有字母都会自动转换为小写字母。

据我所知,当我使用 TermDocumentMatrix 函数时会发生这种情况。是否有可能阻止函数将所有字母转换为小写字母?

您可以通过在控制列表中指定 tolower=FALSE 来阻止 TermDocumentMatrix 将所有内容转换为小写。由于您不提供任何数据,我将使用 tm 包中提供的示例数据进行说明。

library(wordcloud)
library(tm)
data(crude)

tdm = TermDocumentMatrix(crude, 
    control=list(removePunctuation=T, tolower=F, stopwords=T))
WordFreq = slam::row_sums(tdm[tdm$dimnames$Terms, ])
FrequentWords = tail(sort(WordFreq), 20)
wordcloud(names(FrequentWords), FrequentWords)