删除 R 中的特殊撇号
Remove special apostrophe in R
我正在做一些文本挖掘,我想从我的文本中删除撇号 "(删除它)。我尝试如下使用 gsub 但它不起作用
text <- "\"branch"
removeSpecialChars <- function(x){
result <- gsub('"',x)
return(result)
}
without <- removeSpecialChars(text)
所需的输出将是分支而不是“分支。感谢您的帮助
编辑以更进一步(我正在尝试清理文本)。
输入是一个包含很多不同字符串的列表。例如
Input <- list(c("e","b", "Whosebug", "\"branch"))
cleanCorpus <- function(corpus){
corpus.tmp <- tm_map(corpus, removePunctuation,preserve_intra_word_dashes = TRUE)
removeSpecialChars <- function(x){
result <- gsub('"', "",x)
return(result)
}
corpus.tmp <- removeSpecialChars(corpus.tmp)
corpus.tmp <- tm_map(corpus.tmp, stripWhitespace)
corpus.tmp <- tm_map(corpus.tmp, content_transformer(tolower))
corpus.tmp <- tm_map(corpus.tmp, removeWords, stopwords("english"))
return(corpus.tmp)
}
result <- cleanCorpus(Input)
result <- gsub("\"",text)
会为你工作。您需要使用 .
覆盖那个 "
我们需要使用 replacement
gsub('"', "", text)
#[1] "branch"
数据
text <- "\"branch"
我正在做一些文本挖掘,我想从我的文本中删除撇号 "(删除它)。我尝试如下使用 gsub 但它不起作用
text <- "\"branch"
removeSpecialChars <- function(x){
result <- gsub('"',x)
return(result)
}
without <- removeSpecialChars(text)
所需的输出将是分支而不是“分支。感谢您的帮助
编辑以更进一步(我正在尝试清理文本)。
输入是一个包含很多不同字符串的列表。例如
Input <- list(c("e","b", "Whosebug", "\"branch"))
cleanCorpus <- function(corpus){
corpus.tmp <- tm_map(corpus, removePunctuation,preserve_intra_word_dashes = TRUE)
removeSpecialChars <- function(x){
result <- gsub('"', "",x)
return(result)
}
corpus.tmp <- removeSpecialChars(corpus.tmp)
corpus.tmp <- tm_map(corpus.tmp, stripWhitespace)
corpus.tmp <- tm_map(corpus.tmp, content_transformer(tolower))
corpus.tmp <- tm_map(corpus.tmp, removeWords, stopwords("english"))
return(corpus.tmp)
}
result <- cleanCorpus(Input)
result <- gsub("\"",text)
会为你工作。您需要使用 .
我们需要使用 replacement
gsub('"', "", text)
#[1] "branch"
数据
text <- "\"branch"