在 tibble 嵌套 tibbles 中(在 list-columns 内),如何更新 tibbles 以使用通用名称重命名列?
In a tibble nesting tibbles (inside list-columns), how to update tibbles to rename columns with a common name?
使用 purrr
,我将 iris
数据汇总到一个新的变异 list-column:
library(tidyverse)
my_tibble <-
iris %>%
nest(data = everything()) %>%
mutate(summary_tbl = map(.x = data,
~ .x %>%
group_by(Species) %>%
summarise(mean_by_cat = mean(Sepal.Length))))
my_tibble
#> # A tibble: 1 x 2
#> data summary_tbl
#> <list> <list>
#> 1 <tibble [150 x 5]> <tibble [3 x 2]>
由 reprex package (v0.3.0)
于 2021 年 3 月 16 日创建
如果我们取消嵌套 data
或 summary_tbl
我们可以看到两者都包含一个小标题,有一些重叠的列名(在本例中 Species
):
my_tibble %>%
pull(data)
## [[1]]
## # A tibble: 150 x 5
## Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## <dbl> <dbl> <dbl> <dbl> <fct>
## 1 5.1 3.5 1.4 0.2 setosa
## 2 4.9 3 1.4 0.2 setosa
## 3 4.7 3.2 1.3 0.2 setosa
## 4 4.6 3.1 1.5 0.2 setosa
## 5 5 3.6 1.4 0.2 setosa
## 6 5.4 3.9 1.7 0.4 setosa
## 7 4.6 3.4 1.4 0.3 setosa
## 8 5 3.4 1.5 0.2 setosa
## 9 4.4 2.9 1.4 0.2 setosa
## 10 4.9 3.1 1.5 0.1 setosa
## # ... with 140 more rows
my_tibble %>%
pull(summary_tbl)
## [[1]]
## # A tibble: 3 x 2
## Species mean_by_cat
## * <fct> <dbl>
## 1 setosa 5.01
## 2 versicolor 5.94
## 3 virginica 6.59
是否有一种有效的方法来重命名出现在 的 list-column 的 的任何 中的列名称?
例如,如果我们定义:
var_to_rename <- "Species"
new_name <- "my_grouping_var"
那么提供了my_tibble
、var_to_rename
和new_name
,我们如何通过编程方式得到以下内容呢?
my_tibble %>%
pull(data)
## [[1]]
## # A tibble: 150 x 5
## Sepal.Length Sepal.Width Petal.Length Petal.Width my_grouping_var
## <dbl> <dbl> <dbl> <dbl> <fct>
## 1 5.1 3.5 1.4 0.2 setosa
## 2 4.9 3 1.4 0.2 setosa
## 3 4.7 3.2 1.3 0.2 setosa
## 4 4.6 3.1 1.5 0.2 setosa
## 5 5 3.6 1.4 0.2 setosa
## 6 5.4 3.9 1.7 0.4 setosa
## 7 4.6 3.4 1.4 0.3 setosa
## 8 5 3.4 1.5 0.2 setosa
## 9 4.4 2.9 1.4 0.2 setosa
## 10 4.9 3.1 1.5 0.1 setosa
## # ... with 140 more rows
my_tibble %>%
pull(summary_tbl)
## [[1]]
## # A tibble: 3 x 2
## my_grouping_var mean_by_cat
## * <fct> <dbl>
## 1 setosa 5.01
## 2 versicolor 5.94
## 3 virginica 6.59
显然我可以在 mutate
部分之前将 Species
重命名为 my_grouping_var
,但我的问题是在事后重命名现有的 tibble。
你可以这样做:
library(dplyr)
my_tibble <- my_tibble %>%
mutate(across(.fns = ~.[[1]] %>%
rename_with(~new_name, all_of(var_to_rename)) %>% list()))
my_tibble %>% pull(summary_tbl)
#[[1]]
# A tibble: 3 x 2
# my_grouping_var mean_by_cat
#* <fct> <dbl>
#1 setosa 5.01
#2 versicolor 5.94
#3 virginica 6.59
如果您想使用一个函数,您可以将 rename()
与大写运算符 ({{}}
) 和等号运算符 (:=
) 结合使用:
foo = function(var_to_rename, new_name){
my_tibble %>%
mutate(summary_tbl = map(summary_tbl, ~{
rename(.x, {{new_name}}:={{var_to_rename}})
}))
}
my_tibble2=foo("Species", "my_grouping_var")
my_tibble2 %>%
pull(summary_tbl)
#> [[1]]
#> # A tibble: 3 x 2
#> my_grouping_var mean_by_cat
#> <fct> <dbl>
#> 1 setosa 5.01
#> 2 versicolor 5.94
#> 3 virginica 6.59
由 reprex package (v1.0.0)
于 2021 年 3 月 16 日创建
有关如何在 https://dplyr.tidyverse.org/articles/programming.html.
上的函数中使用 dplyr
的整洁求值的更多信息
使用 purrr
,我将 iris
数据汇总到一个新的变异 list-column:
library(tidyverse)
my_tibble <-
iris %>%
nest(data = everything()) %>%
mutate(summary_tbl = map(.x = data,
~ .x %>%
group_by(Species) %>%
summarise(mean_by_cat = mean(Sepal.Length))))
my_tibble
#> # A tibble: 1 x 2
#> data summary_tbl
#> <list> <list>
#> 1 <tibble [150 x 5]> <tibble [3 x 2]>
由 reprex package (v0.3.0)
于 2021 年 3 月 16 日创建如果我们取消嵌套 data
或 summary_tbl
我们可以看到两者都包含一个小标题,有一些重叠的列名(在本例中 Species
):
my_tibble %>%
pull(data)
## [[1]]
## # A tibble: 150 x 5
## Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## <dbl> <dbl> <dbl> <dbl> <fct>
## 1 5.1 3.5 1.4 0.2 setosa
## 2 4.9 3 1.4 0.2 setosa
## 3 4.7 3.2 1.3 0.2 setosa
## 4 4.6 3.1 1.5 0.2 setosa
## 5 5 3.6 1.4 0.2 setosa
## 6 5.4 3.9 1.7 0.4 setosa
## 7 4.6 3.4 1.4 0.3 setosa
## 8 5 3.4 1.5 0.2 setosa
## 9 4.4 2.9 1.4 0.2 setosa
## 10 4.9 3.1 1.5 0.1 setosa
## # ... with 140 more rows
my_tibble %>%
pull(summary_tbl)
## [[1]]
## # A tibble: 3 x 2
## Species mean_by_cat
## * <fct> <dbl>
## 1 setosa 5.01
## 2 versicolor 5.94
## 3 virginica 6.59
是否有一种有效的方法来重命名出现在 的 list-column 的 的任何 中的列名称? 例如,如果我们定义:
var_to_rename <- "Species"
new_name <- "my_grouping_var"
那么提供了my_tibble
、var_to_rename
和new_name
,我们如何通过编程方式得到以下内容呢?
my_tibble %>%
pull(data)
## [[1]]
## # A tibble: 150 x 5
## Sepal.Length Sepal.Width Petal.Length Petal.Width my_grouping_var
## <dbl> <dbl> <dbl> <dbl> <fct>
## 1 5.1 3.5 1.4 0.2 setosa
## 2 4.9 3 1.4 0.2 setosa
## 3 4.7 3.2 1.3 0.2 setosa
## 4 4.6 3.1 1.5 0.2 setosa
## 5 5 3.6 1.4 0.2 setosa
## 6 5.4 3.9 1.7 0.4 setosa
## 7 4.6 3.4 1.4 0.3 setosa
## 8 5 3.4 1.5 0.2 setosa
## 9 4.4 2.9 1.4 0.2 setosa
## 10 4.9 3.1 1.5 0.1 setosa
## # ... with 140 more rows
my_tibble %>%
pull(summary_tbl)
## [[1]]
## # A tibble: 3 x 2
## my_grouping_var mean_by_cat
## * <fct> <dbl>
## 1 setosa 5.01
## 2 versicolor 5.94
## 3 virginica 6.59
显然我可以在 mutate
部分之前将 Species
重命名为 my_grouping_var
,但我的问题是在事后重命名现有的 tibble。
你可以这样做:
library(dplyr)
my_tibble <- my_tibble %>%
mutate(across(.fns = ~.[[1]] %>%
rename_with(~new_name, all_of(var_to_rename)) %>% list()))
my_tibble %>% pull(summary_tbl)
#[[1]]
# A tibble: 3 x 2
# my_grouping_var mean_by_cat
#* <fct> <dbl>
#1 setosa 5.01
#2 versicolor 5.94
#3 virginica 6.59
如果您想使用一个函数,您可以将 rename()
与大写运算符 ({{}}
) 和等号运算符 (:=
) 结合使用:
foo = function(var_to_rename, new_name){
my_tibble %>%
mutate(summary_tbl = map(summary_tbl, ~{
rename(.x, {{new_name}}:={{var_to_rename}})
}))
}
my_tibble2=foo("Species", "my_grouping_var")
my_tibble2 %>%
pull(summary_tbl)
#> [[1]]
#> # A tibble: 3 x 2
#> my_grouping_var mean_by_cat
#> <fct> <dbl>
#> 1 setosa 5.01
#> 2 versicolor 5.94
#> 3 virginica 6.59
由 reprex package (v1.0.0)
于 2021 年 3 月 16 日创建有关如何在 https://dplyr.tidyverse.org/articles/programming.html.
上的函数中使用dplyr
的整洁求值的更多信息