删除R中数据中不需要的符号

Remove unnecessary symbols in the data in R

这是我的数据集

1.abc
2.def
3.2354
4.. $.?,

我怎样才能删除那些只有数字的obs,其中只有点,逗号等符号......,好吧,其中任何符号和数字(1#5??%)。以及文本中的单词其中少于两个字母

我们可以使用str_count来计算字符数并对数据集进行子集化

library(stringr)
library(dplyr)
df1 %>%
    filter(str_count(v1, "[[:alpha:]]") > 2)

或用gsub删除任何不是字母的字符并用nchar计算字符数以创建子集

的逻辑索引
subset(df1, nchar(gsub("[^[:alpha:]]+", "", v1))>2)
#    v1
#1 1.abc
#2 2.def

数据

df1 <- structure(list(v1 = c("1.abc", "2.def", "3.2354", "4.. $.?,")), 
.Names = "v1", class = "data.frame", row.names = c(NA, -4L))