R:使用 TermDocumentMatrix 保持大写
R: Keep Upper Case with TermDocumentMatrix
我想用 wordcloud
包创建一个词云。我的问题是我想在单词的开头保留大写字母,但所有字母都会自动转换为小写字母。
据我所知,当我使用 TermDocumentMatrix
函数时会发生这种情况。是否有可能阻止函数将所有字母转换为小写字母?
您可以通过在控制列表中指定 tolower=FALSE
来阻止 TermDocumentMatrix
将所有内容转换为小写。由于您不提供任何数据,我将使用 tm 包中提供的示例数据进行说明。
library(wordcloud)
library(tm)
data(crude)
tdm = TermDocumentMatrix(crude,
control=list(removePunctuation=T, tolower=F, stopwords=T))
WordFreq = slam::row_sums(tdm[tdm$dimnames$Terms, ])
FrequentWords = tail(sort(WordFreq), 20)
wordcloud(names(FrequentWords), FrequentWords)
我想用 wordcloud
包创建一个词云。我的问题是我想在单词的开头保留大写字母,但所有字母都会自动转换为小写字母。
据我所知,当我使用 TermDocumentMatrix
函数时会发生这种情况。是否有可能阻止函数将所有字母转换为小写字母?
您可以通过在控制列表中指定 tolower=FALSE
来阻止 TermDocumentMatrix
将所有内容转换为小写。由于您不提供任何数据,我将使用 tm 包中提供的示例数据进行说明。
library(wordcloud)
library(tm)
data(crude)
tdm = TermDocumentMatrix(crude,
control=list(removePunctuation=T, tolower=F, stopwords=T))
WordFreq = slam::row_sums(tdm[tdm$dimnames$Terms, ])
FrequentWords = tail(sort(WordFreq), 20)
wordcloud(names(FrequentWords), FrequentWords)