如何在没有变量的情况下以编程方式使用 dplyr across()？

Question

问题：

我想以编程方式使用 across() NULL 或空字符串传递给它，函数不会失败。这可能使用了函数的作用域变体，例如 group_by_at()，但我想让它使用 across().

整齐地工作（即没有 if 语句）

另请注意，如果留空，目前 across() 将影响所有列。我不确定这样做的动机是什么；对我来说，如果没有列受到影响会更有意义。

例子

这是一个使用函数计算变量均值的简单示例 y。传递分组变量适用于 group_by_at()，但不适用于 across()，如下所示：

my_df <- tibble("x" = c("a", "a", "b", "b"), y = 1:4)

compute_mean1 <- function(df, grouping) { # compute grouped mean with across()
  df %>% 
    group_by(across(all_of(grouping))) %>% 
    summarise(y = mean(y), .groups = "drop")
}

compute_mean2 <- function(df, grouping) { # compute grouped mean with group_by_at()
  df %>% 
    group_by_at(grouping) %>% 
    summarise(y = mean(y), .groups = "drop")
}


compute_mean1(my_df, "x")
#> # A tibble: 2 x 2
#>   x         y
#>   <chr> <dbl>
#> 1 a       1.5
#> 2 b       3.5
compute_mean1(my_df, NULL)
#> Error: `vars` must be a character vector.
compute_mean2(my_df, "x")
#> # A tibble: 2 x 2
#>   x         y
#>   <chr> <dbl>
#> 1 a       1.5
#> 2 b       3.5
compute_mean2(my_df, NULL)
#> # A tibble: 1 x 1
#>       y
#>   <dbl>
#> 1   2.5

^{由 reprex package (v0.3.0)}

于 2020 年 7 月 14 日创建

Answer 1

像这样使用.add=TRUE：

compute_mean3 <- function(df, grouping) { # compute grouped mean with across()
  df %>% 
    group_by(across(all_of(grouping)), .add = TRUE) %>%
    summarise(y = mean(y), .groups = "drop")
}

如何在没有变量的情况下以编程方式使用 dplyr across()？

How can I use dplyr across() programmatically on no variables?

variables

evaluation

r

dplyr

across

问题：

例子