加宽 R 数据框

Question

我正在尝试在 R 中加宽数据框，但似乎以一种不寻常的方式进行，因为在此处进行了大量搜索后，我一直无法找到一种简单的方法。

假设我有一个这样的数据框，其中 ID 是一个数字，用于标识一个唯一的人，这个唯一的人可能有几个与之关联的代码：

ID<-c(1, 2, 2, 2, 3, 3,4)
CODE<-c(123, 938, 293, 456, 203, 203, 91)
df <- data.frame(ID, CODE)

我想加宽它，以便每个 ID 只有一行，并将代码添加到其他列中。这应该会导致生成与具有最多关联代码的 ID 的代码一样多的新列。例如，如果一个 ID 只有一个代码，那么在第一个之后的所有新生成的列都应该用 NA 填充。生成的数据框应如下所示：

ID	CODE1	CODE2	CODE3
1	123	NA	NA
2	938	293	456
3	203	203	NA
4	91	NA	NA

如果重复的代码也能被删除，结果实际上是这样的（这样 ID 3 的 203 第二次出现就变成 NA）就更好了：

ID	CODE1	CODE2	CODE3
1	123	NA	NA
2	938	293	456
3	203	NA	NA
4	91	NA	NA

我可以通过连接代码（通过 group_by 和总结）然后将代码分成单独的列来做到这一点，但我想有更直接的方法来做到这一点。

感谢您的任何建议！

Answer 1

library(tidyverse)
df %>%
  distinct(ID, CODE) %>%
  group_by(ID) %>%
  mutate(col = paste0("CODE", row_number())) %>%
  ungroup() %>%
  pivot_wider(names_from = col, values_from = CODE)

结果

# A tibble: 4 x 4
     ID CODE1 CODE2 CODE3
  <dbl> <dbl> <dbl> <dbl>
1     1   123    NA    NA
2     2   938   293   456
3     3   203    NA    NA
4     4    91    NA    NA

加宽 R 数据框

Widen R dataframe

pivot

r

reshape

dataframe