在 R 中查找不在另一个数据框的另一列中的列中的元素

Find elements in a column that is not in another column of another dataframe in R

我有两个看起来像这样的数据框:

dat <- data.frame(col1 = c(1:100))
dat2 <- data.frame(col2 = c(5:105))

我想找到 dat 中但不在 dat2 中的所有元素。我该怎么做?

谢谢!

您可以使用过滤连接,例如

dplyr::anti_join(dat,dat2, by = c("col1" = "col2"))

或直接通过 filter

library(dplyr)
dat %>% filter(!col1 %in% dat2$col2)

输出:

  col1
1    1
2    2
3    3
4    4

您可以使用 setdiff:

setdiff(dat$col1, dat2$col2)
#[1] 1 2 3 4

选项使用 data.table:

library(data.table)
setDT(dat)
setDT(dat2)
dat[!dat2, on = .(col1 = col2)]

输出:

   col1
1:    1
2:    2
3:    3
4:    4