R - 按组将数据转换和转置到列

R - Convert and transpose data to columns by group

在尝试 tidyr、reshape、spread 等努力解决这个挑战几个小时后,我将非常感谢 R 专家的帮助

对于包含不同组和分配值的数据框,是否有一种方法可以转换和转置数据框,以便将每个组分配给一个新列,并且所有分配值都列在该组下?

这是数据框的一些示例代码:

a <- c("Group1", "Group1", "Group1", "Group2", "Group2", "Group2", "Group2", "Group2", "Group3")
b <- c("Item1", "Item2", "Item3", "Item4", "Item5", "Item6", "Item7", "Item8", "Item9") 

使用这两列,为每个组创建一个新列。

下面,我手动展示了这个,但需要 R 来自动执行下一步。

我手动添加了“--”以避免错误 "Error in data.frame: arguments imply differing number of rows"。实际上,我无法为每个组添加“--”。

Group1 <- c("Item1", "Item2", "Item3", "--", "--")
Group2 <- c("Item4", "Item5", "Item6", "Item7", "Item8")
Group3 <- c("Item9", "--", "--", "--", "--")

下面,这是我尝试创建的输出。

table <- data.frame(Group1, Group2, Group3)

挑战在于变量必须是动态的。组数和项目数会随着数据集的不同而变化,我无法手动为每组的空白“--”。

问题和这个类似,只是我的问题涉及到动态范围。 Convert data frame common rows to columns

我们可以用tidyr::spread

library(tidyverse)
df %>% group_by(a) %>% mutate(n = 1:n()) %>% spread(a, b) %>% select(-n)
## A tibble: 5 x 3
#  Group1 Group2 Group3
#  <fct>  <fct>  <fct>
#1 Item1  Item4  Item9
#2 Item2  Item5  NA
#3 Item3  Item6  NA
#4 NA     Item7  NA
#5 NA     Item8  NA

或者如果你更喜欢 "--" 而不是 NA 你可以这样做(感谢@AntoniosK)

df %>%
    group_by(a) %>%
    mutate(n = 1:n()) %>%
    spread(a, b) %>%
    select(-n) %>%
    mutate_all(~ifelse(is.na(.), "--", as.character(.)))
## A tibble: 5 x 3
#  Group1 Group2 Group3
#  <chr>  <chr>  <chr>
#1 Item1  Item4  Item9
#2 Item2  Item5  --
#3 Item3  Item6  --
#4 --     Item7  --
#5 --     Item8  --

或使用 tidyr::spreads fill 参数

df %>%
    mutate_if(is.factor, as.character) %>%
    group_by(a) %>%
    mutate(n = 1:n()) %>%
    spread(a, b, fill = "--") %>%
    select(-n)

给出相同的结果。


示例数据

a <- c("Group1", "Group1", "Group1", "Group2", "Group2", "Group2", "Group2", "Group2", "Group3")
b <- c("Item1", "Item2", "Item3", "Item4", "Item5", "Item6", "Item7", "Item8", "Item9")
df <- data.frame(a = a, b = b)