删除 R 中的所有非拉丁字符
deleting all not latin characters in R
这里有两个字符串
*3472459 PIVO 何か-何か-何か/100х1,5g
*3472459 VINO 何か何か何か100х1,5g
如何删除所有非拉丁字符?
输出应该是
PIVO
Vino
给定 text 中的文本字符串,str_extract
来自 stringr 或 stri_extract
来自 stringi returns 预期结果。
text <- c("*3472459 PIVO 何か-何か-何か/100х1,5g",
"*3472459 VINO 何か何か何か100х1,5g")
stringr::str_extract(text, "[:alpha:]+")
[1] "PIVO" "VINO"
stringi::stri_extract(text, regex = "[:alpha:]+")
[1] "PIVO" "VINO"
这里有两个字符串
*3472459 PIVO 何か-何か-何か/100х1,5g
*3472459 VINO 何か何か何か100х1,5g
如何删除所有非拉丁字符? 输出应该是
PIVO
Vino
给定 text 中的文本字符串,str_extract
来自 stringr 或 stri_extract
来自 stringi returns 预期结果。
text <- c("*3472459 PIVO 何か-何か-何か/100х1,5g",
"*3472459 VINO 何か何か何か100х1,5g")
stringr::str_extract(text, "[:alpha:]+")
[1] "PIVO" "VINO"
stringi::stri_extract(text, regex = "[:alpha:]+")
[1] "PIVO" "VINO"