从字符串向量中仅提取包含 ASCII 字符的单词
Extract only words containing ASCII characters from vector of strings
我一直坚持,所以,欢迎任何建议。
b <- str_extract_all(c('hello ringпрг','trust'), regex("[a-z]+", TRUE))
Returns 一个列表:
List of 2
$ : chr [1:2] "hello" "ring"
$ : chr "trust"
但是我想为向量 c('hello ringпрг','trust')
的每个元素创建一个包含此单词字符串的向量,例如 "hello ring", "trust"
。也欢迎任何其他功能和包。
我们可以使用
unlist(str_extract_all(c('hello ringпрг','trust'), regex("[A-Za-z ]+", TRUE)))
#[1] "hello ring" "trust"
或使用模式 "[[:ascii:]]+"
将 sapply
与 paste
一起使用,如:
b<-str_extract_all(c('hello ringпрг','trust'), regex("[a-z]+", TRUE))
sapply(b, paste, collapse = " ")
## [1] "hello ring" "trust"
我一直坚持,所以,欢迎任何建议。
b <- str_extract_all(c('hello ringпрг','trust'), regex("[a-z]+", TRUE))
Returns 一个列表:
List of 2
$ : chr [1:2] "hello" "ring"
$ : chr "trust"
但是我想为向量 c('hello ringпрг','trust')
的每个元素创建一个包含此单词字符串的向量,例如 "hello ring", "trust"
。也欢迎任何其他功能和包。
我们可以使用
unlist(str_extract_all(c('hello ringпрг','trust'), regex("[A-Za-z ]+", TRUE)))
#[1] "hello ring" "trust"
或使用模式 "[[:ascii:]]+"
将 sapply
与 paste
一起使用,如:
b<-str_extract_all(c('hello ringпрг','trust'), regex("[a-z]+", TRUE))
sapply(b, paste, collapse = " ")
## [1] "hello ring" "trust"