bind_rows 每组小标题

Question

考虑以下两个 tibbles:

library(tidyverse)
a <- tibble(time = c(-1, 0), value = c(100, 200))
b <- tibble(id = rep(letters[1:2], each = 3), time = rep(1:3, 2), value = 1:6)

所以 a 和 b 具有相同的列，并且 b 有一个名为 id 的附加列。我想执行以下操作：按 id 对 b 进行分组，然后在每个组的顶部添加 tibble a。所以输出应该是这样的：

# A tibble: 10 x 3
   id     time value
   <chr> <int> <int>
 1 a        -1     100
 2 a         0     200
 3 a         1     1
 4 a         2     2
 5 a         3     3
 6 b        -1     100
 7 b         0     200
 8 b         1     4
 9 b         2     5
10 b         3     6

当然有多种解决方法可以实现这一点（例如循环）。但就我而言，我有大量的 ID 和非常多的列。如果有人能指出我在 tidyverse 中找到解决方案的方向，我将不胜感激。

谢谢

Answer 1

split from base R 将根据索引将数据帧划分为子集列表。

b %>%
  split(b[["id"]]) %>%
  lapply(bind_rows, a) %>%
  lapply(select, -"id") %>%
  bind_rows(.id = "id")
# # A tibble: 10 x 3
#    id     time value
#    <chr> <dbl> <dbl>
#  1 a         1     1
#  2 a         2     2
#  3 a         3     3
#  4 a        -1   100
#  5 a         0   200
#  6 b         1     4
#  7 b         2     5
#  8 b         3     6
#  9 b        -1   100
# 10 b         0   200

Answer 2

我们可以用 b 的 id 扩展数据框 a，然后将它们 bind_rows 一起扩展。

library(tidyverse)

a2 <- expand(a, id = b$id, nesting(time, value))
b2 <- bind_rows(a2, b) %>% arrange(id, time)
b2
# # A tibble: 10 x 3
#    id     time value
#    <chr> <dbl> <dbl>
#  1 a        -1   100
#  2 a         0   200
#  3 a         1     1
#  4 a         2     2
#  5 a         3     3
#  6 b        -1   100
#  7 b         0   200
#  8 b         1     4
#  9 b         2     5
# 10 b         3     6

Answer 3

一个想法（通过 base R）是拆分你的数据框并创建一个新的 id + 另一个数据框和 rbind，即

df = do.call(rbind, lapply(split(b, b$id), function(i)rbind(data.frame(id = i$id[1], a), i)))

这给出了

    id time value
a.1  a   -1   100
a.2  a    0   200
a.3  a    1     1
a.4  a    2     2
a.5  a    3     3
b.1  b   -1   100
b.2  b    0   200
b.3  b    1     4
b.4  b    2     5
b.5  b    3     6

注意： 您只需调用 rownames(df) <- NULL

即可删除行名

Answer 4

也许不是最有效的方法，但很容易遵循：

library(tidyverse)
a <- tibble(time = c(-1, 0), value = c(100, 200))
b <- tibble(id = rep(letters[1:2], each = 3), time = rep(1:3, 2), value = 
1:6)

a.a <- a %>% add_column(id = rep("a",length(a)))
a.b <- a %>% add_column(id = rep("b",length(a)))
joint <- bind_rows(b,a.a,a.b)
(joint <- arrange(joint,id))

Answer 5

我们可以嵌套并将相关行添加到每个嵌套项中：

library(tidyverse)

b %>%
  nest(-id) %>%
  mutate(data= map(data,~bind_rows(a,.x))) %>%
  unnest

# # A tibble: 10 x 3
#       id  time value
#    <chr> <dbl> <dbl>
#  1     a    -1   100
#  2     a     0   200
#  3     a     1     1
#  4     a     2     2
#  5     a     3     3
#  6     b    -1   100
#  7     b     0   200
#  8     b     1     4
#  9     b     2     5
# 10     b     3     6

bind_rows 每组小标题

bind_rows to each group of tibble

r

tidyverse

tibble