在 tibble 嵌套 tibbles 中(在 list-columns 内),如何更新 tibbles 以使用通用名称重命名列?

In a tibble nesting tibbles (inside list-columns), how to update tibbles to rename columns with a common name?

使用 purrr,我将 iris 数据汇总到一个新的变异 list-column:

library(tidyverse)

my_tibble <-
  iris %>%
  nest(data = everything()) %>%
  mutate(summary_tbl = map(.x = data,
                           ~ .x %>%
                             group_by(Species) %>%
                             summarise(mean_by_cat = mean(Sepal.Length))))

my_tibble
#> # A tibble: 1 x 2
#>   data               summary_tbl     
#>   <list>             <list>          
#> 1 <tibble [150 x 5]> <tibble [3 x 2]>

reprex package (v0.3.0)

于 2021 年 3 月 16 日创建

如果我们取消嵌套 datasummary_tbl 我们可以看到两者都包含一个小标题,有一些重叠的列名(在本例中 Species):

my_tibble %>%
  pull(data)

## [[1]]
## # A tibble: 150 x 5
##    Sepal.Length Sepal.Width Petal.Length Petal.Width Species
##           <dbl>       <dbl>        <dbl>       <dbl> <fct>  
##  1          5.1         3.5          1.4         0.2 setosa 
##  2          4.9         3            1.4         0.2 setosa 
##  3          4.7         3.2          1.3         0.2 setosa 
##  4          4.6         3.1          1.5         0.2 setosa 
##  5          5           3.6          1.4         0.2 setosa 
##  6          5.4         3.9          1.7         0.4 setosa 
##  7          4.6         3.4          1.4         0.3 setosa 
##  8          5           3.4          1.5         0.2 setosa 
##  9          4.4         2.9          1.4         0.2 setosa 
## 10          4.9         3.1          1.5         0.1 setosa 
## # ... with 140 more rows

my_tibble %>%
  pull(summary_tbl)

## [[1]]
## # A tibble: 3 x 2
##   Species    mean_by_cat
## * <fct>            <dbl>
## 1 setosa            5.01
## 2 versicolor        5.94
## 3 virginica         6.59

是否有一种有效的方法来重命名出现在 的 list-column 的 的任何 中的列名称? 例如,如果我们定义:

var_to_rename <- "Species"
new_name <- "my_grouping_var"

那么提供了my_tibblevar_to_renamenew_name,我们如何通过编程方式得到以下内容呢?

my_tibble %>%
  pull(data)

## [[1]]
## # A tibble: 150 x 5
##    Sepal.Length Sepal.Width Petal.Length Petal.Width my_grouping_var
##           <dbl>       <dbl>        <dbl>       <dbl> <fct>  
##  1          5.1         3.5          1.4         0.2 setosa 
##  2          4.9         3            1.4         0.2 setosa 
##  3          4.7         3.2          1.3         0.2 setosa 
##  4          4.6         3.1          1.5         0.2 setosa 
##  5          5           3.6          1.4         0.2 setosa 
##  6          5.4         3.9          1.7         0.4 setosa 
##  7          4.6         3.4          1.4         0.3 setosa 
##  8          5           3.4          1.5         0.2 setosa 
##  9          4.4         2.9          1.4         0.2 setosa 
## 10          4.9         3.1          1.5         0.1 setosa 
## # ... with 140 more rows

my_tibble %>%
  pull(summary_tbl)

## [[1]]
## # A tibble: 3 x 2
##   my_grouping_var  mean_by_cat
## * <fct>            <dbl>
## 1 setosa            5.01
## 2 versicolor        5.94
## 3 virginica         6.59

显然我可以在 mutate 部分之前将 Species 重命名为 my_grouping_var,但我的问题是在事后重命名现有的 tibble。

你可以这样做:

library(dplyr)

my_tibble <- my_tibble %>%
                 mutate(across(.fns = ~.[[1]] %>% 
                     rename_with(~new_name, all_of(var_to_rename)) %>% list()))

my_tibble %>% pull(summary_tbl)

#[[1]]
# A tibble: 3 x 2
#  my_grouping_var mean_by_cat
#* <fct>                 <dbl>
#1 setosa                 5.01
#2 versicolor             5.94
#3 virginica              6.59

如果您想使用一个函数,您可以将 rename() 与大写运算符 ({{}}) 和等号运算符 (:=) 结合使用:

foo = function(var_to_rename, new_name){
  my_tibble %>% 
    mutate(summary_tbl = map(summary_tbl, ~{
      rename(.x, {{new_name}}:={{var_to_rename}})
    }))
}
my_tibble2=foo("Species", "my_grouping_var")

my_tibble2 %>%
  pull(summary_tbl)
#> [[1]]
#> # A tibble: 3 x 2
#>   my_grouping_var mean_by_cat
#>   <fct>                 <dbl>
#> 1 setosa                 5.01
#> 2 versicolor             5.94
#> 3 virginica              6.59

reprex package (v1.0.0)

于 2021 年 3 月 16 日创建

有关如何在 https://dplyr.tidyverse.org/articles/programming.html.

上的函数中使用 dplyr 的整洁求值的更多信息