Reshape2：变量的多个观察值

Question

我有以下示例数据：

d <- data.frame(id=c(1,1,1,2,2), time=c(1,1,1,1,1), var=runif(5))
  id time         var
1  1    1 0.373448545
2  1    1 0.007007124
3  1    1 0.840572603
4  2    1 0.684893481
5  2    1 0.822581501

我想使用 dcast 将此 data.frame 重塑为 wide 格式，以便输出如下：

  id     var.1       var.2     var.3
1  1 0.3734485 0.007007124 0.8405726
2  2 0.6848935 0.822581501        NA

有没有人有一些想法？

Answer 1

通过 id 创建序列列 seq，然后使用 dcast:

library(reshape2)

set.seed(123)
d <- data.frame(id=c(1,1,1,2,2), time=c(1,1,1,1,1), var=runif(5))

d2 <- transform(d, seq = ave(id, id, FUN = seq_along))
dcast(d2, id ~ seq, value.var = "var")

给予：

  id       1       2       3
1  1 0.28758 0.78831 0.40898
2  2 0.88302 0.94047     NaN

Answer 2

好的 - 这是一个可行的解决方案。关键是添加一个计数变量。我的解决方案有点复杂 - 也许你能想出更好的办法。

library(dplyr)
library(magrittr)
library(reshape2)

d <- data.frame(id=c(1,1,1,2,2,3,3,3,3), time=c(1,1,1,1,1,1,1,1,1), var=runif(9))

group_by(d, id) %>%
  summarise(n = n()) %>%
  data.frame() -> count

f <- c()
for (i in 1:nrow(count)) {
  f <- c(f, 1:count$n[i])
}

d <- data.frame(d, f)

dcast(d, id ~ f, value.var = "var")

Answer 3

带有 spread 的 dplyr/tidyr 选项将是

library(dplyr)
library(tidyr)
d %>%
  group_by(id) %>%
  mutate(n1= paste0("var.",row_number())) %>% 
  spread(n1, var) %>%
  select(-time)
#      id     var.1       var.2     var.3
#    (int)     (dbl)       (dbl)     (dbl)
#1     1 0.3734485 0.007007124 0.8405726
#2     2 0.6848935 0.822581501        NA

Reshape2：变量的多个观察值

Reshape2: multiple observations for variable

casting

r

reshape2