select 来自数据框 R 中多个文本组合的文本

select text from multiple combinations of text within a dataframe R

我想根据在 df 的一列中以多种组合使用的文本代码对数据进行子集化。我首先通过创建 table.

检查了所有变体
 list <-  as.data.frame(table(EQP$col1))

我想在数据框中搜索文本 "EFC"(即使与其他字母组合)并对这些行进行子集化,以便我得到一个看起来像这样的结果数据框。

我已经在这里查看了这个问题,但这并没有回答问题。我查看了 tidytext 包,但这似乎也不是解决方案。

您可以简单地使用 grepl

考虑到您的 data.frame 被称为 df 并且子集所在的列是 col1

df <- data.frame(
    col1 = c("eraEFC", "dfs", "asdj, aslkj", "dlja,EFC,:LJ)"),
    stringsAsFactors = F
)

df[grepl("EFC", df$col1), , drop = F]

除了 Gallarus 提到的解决方案之外的另一个选择是:

library(stringr)
library(dplyr)
df %>% filter(str_detect(Var1, "EFC"))

正如 Sam Firke 在 post 中所描述的那样:

Selecting rows where a column has a string like 'hsa..' (partial string match)