合并R中的数据框而不重复

Merge dataframe in R without duplicates

我在 R 中遇到与此类似的问题:

在 R 中做到这一点应该不难,但我就是找不到解决方案。

非常感谢您的帮助!

通过'key'在每个数据中创建一个序列列,然后full_join

library(dplyr)
library(data.table)
df1 %>%
    mutate(rn = rowid(key)) %>% 
   full_join(df2 %>% 
              mutate(rn = rowid(key))) %>%
   select(-rn)

-输出

 key    A    B
1  K0   A0   B0
2  K1   A1   B1
3  K2   A2   B2
4  K2   A3   B3
5  K2   A4 <NA>
6  K3   A5   B4
7  K3 <NA>   B5
8  K4 <NA>   B6

数据

df1 <- structure(list(key = c("K0", "K1", "K2", "K2", "K2", "K3"), A = c("A0", 
"A1", "A2", "A3", "A4", "A5")), class = "data.frame", 
row.names = c("0", 
"1", "2", "3", "4", "5"))

df2 <- structure(list(key = c("K0", "K1", "K2", "K2", "K3", "K3", "K4"
), B = c("B0", "B1", "B2", "B3", "B4", "B5", "B6")), 
class = "data.frame", row.names = c("0", 
"1", "2", "3", "4", "5", "6"))

akrun 的回答很棒(另见评论):我又学到了一些新东西:

大部分都使用 rowid{data.table},这是在每个组中生成唯一行 ID 的便利函数。

dplyr 唯一的解决方案为此需要两个步骤:

library(dplyr)
df1 %>% 
  group_by(key) %>% 
  mutate(id = row_number()) %>% 
  full_join(df2 %>% 
              group_by(key) %>% 
              mutate(id=row_number())) %>% 
  select(-id)

  key   A     B    
  <chr> <chr> <chr>
1 K0    A0    B0   
2 K1    A1    B1   
3 K2    A2    B2   
4 K2    A3    B3   
5 K2    A4    NA   
6 K3    A5    B4   
7 K3    NA    B5   
8 K4    NA    B6