从字符串向量中仅提取包含 ASCII 字符的单词

Extract only words containing ASCII characters from vector of strings

我一直坚持,所以,欢迎任何建议。

b <- str_extract_all(c('hello ringпрг','trust'), regex("[a-z]+", TRUE))

Returns 一个列表:

    List of 2
 $ : chr [1:2] "hello" "ring"
 $ : chr "trust"

但是我想为向量 c('hello ringпрг','trust') 的每个元素创建一个包含此单词字符串的向量,例如 "hello ring", "trust"。也欢迎任何其他功能和包。

我们可以使用

unlist(str_extract_all(c('hello ringпрг','trust'), regex("[A-Za-z ]+", TRUE)))
#[1] "hello ring" "trust" 

或使用模式 "[[:ascii:]]+"

sapplypaste 一起使用,如:

b<-str_extract_all(c('hello ringпрг','trust'), regex("[a-z]+", TRUE))

sapply(b, paste, collapse = " ")

## [1] "hello ring" "trust"