在 tibble 嵌套 tibbles 中（在 list-columns 内），如何更新 tibbles 以使用通用名称重命名列？

Question

使用 purrr，我将 iris 数据汇总到一个新的变异 list-column:

library(tidyverse)

my_tibble <-
  iris %>%
  nest(data = everything()) %>%
  mutate(summary_tbl = map(.x = data,
                           ~ .x %>%
                             group_by(Species) %>%
                             summarise(mean_by_cat = mean(Sepal.Length))))

my_tibble
#> # A tibble: 1 x 2
#>   data               summary_tbl     
#>   <list>             <list>          
#> 1 <tibble [150 x 5]> <tibble [3 x 2]>

^{由 reprex package (v0.3.0)}

于 2021 年 3 月 16 日创建

如果我们取消嵌套 data 或 summary_tbl 我们可以看到两者都包含一个小标题，有一些重叠的列名（在本例中 Species）：

my_tibble %>%
  pull(data)

## [[1]]
## # A tibble: 150 x 5
##    Sepal.Length Sepal.Width Petal.Length Petal.Width Species
##           <dbl>       <dbl>        <dbl>       <dbl> <fct>  
##  1          5.1         3.5          1.4         0.2 setosa 
##  2          4.9         3            1.4         0.2 setosa 
##  3          4.7         3.2          1.3         0.2 setosa 
##  4          4.6         3.1          1.5         0.2 setosa 
##  5          5           3.6          1.4         0.2 setosa 
##  6          5.4         3.9          1.7         0.4 setosa 
##  7          4.6         3.4          1.4         0.3 setosa 
##  8          5           3.4          1.5         0.2 setosa 
##  9          4.4         2.9          1.4         0.2 setosa 
## 10          4.9         3.1          1.5         0.1 setosa 
## # ... with 140 more rows

my_tibble %>%
  pull(summary_tbl)

## [[1]]
## # A tibble: 3 x 2
##   Species    mean_by_cat
## * <fct>            <dbl>
## 1 setosa            5.01
## 2 versicolor        5.94
## 3 virginica         6.59

是否有一种有效的方法来重命名出现在 的 list-column 的 的任何 中的列名称？例如，如果我们定义：

var_to_rename <- "Species" new_name <- "my_grouping_var"

那么提供了my_tibble、var_to_rename和new_name，我们如何通过编程方式得到以下内容呢？

my_tibble %>% pull(data) ## [[1]] ## # A tibble: 150 x 5 ## Sepal.Length Sepal.Width Petal.Length Petal.Width my_grouping_var ## <dbl> <dbl> <dbl> <dbl> <fct> ## 1 5.1 3.5 1.4 0.2 setosa ## 2 4.9 3 1.4 0.2 setosa ## 3 4.7 3.2 1.3 0.2 setosa ## 4 4.6 3.1 1.5 0.2 setosa ## 5 5 3.6 1.4 0.2 setosa ## 6 5.4 3.9 1.7 0.4 setosa ## 7 4.6 3.4 1.4 0.3 setosa ## 8 5 3.4 1.5 0.2 setosa ## 9 4.4 2.9 1.4 0.2 setosa ## 10 4.9 3.1 1.5 0.1 setosa ## # ... with 140 more rows my_tibble %>% pull(summary_tbl) ## [[1]] ## # A tibble: 3 x 2 ## my_grouping_var mean_by_cat ## * <fct> <dbl> ## 1 setosa 5.01 ## 2 versicolor 5.94 ## 3 virginica 6.59

显然我可以在 mutate 部分之前将 Species 重命名为 my_grouping_var，但我的问题是在事后重命名现有的 tibble。

Answer 1

你可以这样做：

library(dplyr)

my_tibble <- my_tibble %>%
                 mutate(across(.fns = ~.[[1]] %>% 
                     rename_with(~new_name, all_of(var_to_rename)) %>% list()))

my_tibble %>% pull(summary_tbl)

#[[1]]
# A tibble: 3 x 2
#  my_grouping_var mean_by_cat
#* <fct>                 <dbl>
#1 setosa                 5.01
#2 versicolor             5.94
#3 virginica              6.59

Answer 2

如果您想使用一个函数，您可以将 rename() 与大写运算符 ({{}}) 和等号运算符 (:=) 结合使用：

foo = function(var_to_rename, new_name){
  my_tibble %>% 
    mutate(summary_tbl = map(summary_tbl, ~{
      rename(.x, {{new_name}}:={{var_to_rename}})
    }))
}
my_tibble2=foo("Species", "my_grouping_var")

my_tibble2 %>%
  pull(summary_tbl)
#> [[1]]
#> # A tibble: 3 x 2
#>   my_grouping_var mean_by_cat
#>   <fct>                 <dbl>
#> 1 setosa                 5.01
#> 2 versicolor             5.94
#> 3 virginica              6.59

^{由 reprex package (v1.0.0)}

于 2021 年 3 月 16 日创建

有关如何在 https://dplyr.tidyverse.org/articles/programming.html.

上的函数中使用 dplyr 的整洁求值的更多信息

在 tibble 嵌套 tibbles 中（在 list-columns 内），如何更新 tibbles 以使用通用名称重命名列？

In a tibble nesting tibbles (inside list-columns), how to update tibbles to rename columns with a common name?

r

rename

dplyr

purrr