检查一个数据框中的值是否存在于 R 中的另一个数据框中
Check if value from one dataframe exists in another dataframe in R
有人可以帮助我如何在 R 编程中做到这一点吗?
请检查link我有同样的情况
使用与原始 Python 示例相同的数据和结果
Df1 <- data.frame(name = c('Marc', 'Jake', 'Sam', 'Brad'))
Df2 <- data.frame(IDs = c('Jake', 'John', 'Marc', 'Tony', 'Bob'))
Df1$presentinDf2 <- as.integer(Df1$name %in% Df2$IDs)
Df1
#> name presentinDf2
#> 1 Marc 1
#> 2 Jake 1
#> 3 Sam 0
#> 4 Brad 0
我不确定这是否是您要查找的内容,但您可以使用 dplyr 包中的 anti_join 创建一个包含数据集之间重复信息的新数据框。
df1 <- data.frame(name = c('Marc', 'Jake', 'Sam', 'Brad'))
df2 <- data.frame(name = c('Jake', 'John', 'Marc', 'Tony', 'Bob'))
diff <- anti_join(df2, df1, by = "name")
> diff
name
1 John
2 Tony
3 Bob
有人可以帮助我如何在 R 编程中做到这一点吗?
请检查link我有同样的情况
使用与原始 Python 示例相同的数据和结果
Df1 <- data.frame(name = c('Marc', 'Jake', 'Sam', 'Brad'))
Df2 <- data.frame(IDs = c('Jake', 'John', 'Marc', 'Tony', 'Bob'))
Df1$presentinDf2 <- as.integer(Df1$name %in% Df2$IDs)
Df1
#> name presentinDf2
#> 1 Marc 1
#> 2 Jake 1
#> 3 Sam 0
#> 4 Brad 0
我不确定这是否是您要查找的内容,但您可以使用 dplyr 包中的 anti_join 创建一个包含数据集之间重复信息的新数据框。
df1 <- data.frame(name = c('Marc', 'Jake', 'Sam', 'Brad'))
df2 <- data.frame(name = c('Jake', 'John', 'Marc', 'Tony', 'Bob'))
diff <- anti_join(df2, df1, by = "name")
> diff
name
1 John
2 Tony
3 Bob