如何在没有变量的情况下以编程方式使用 dplyr across()?
How can I use dplyr across() programmatically on no variables?
问题:
我想以编程方式使用 across()
NULL
或空字符串传递给它,函数不会失败。这可能使用了函数的作用域变体,例如 group_by_at()
,但我想让它使用 across()
.
整齐地工作(即没有 if 语句)
另请注意,如果留空,目前 across()
将影响所有列。我不确定这样做的动机是什么;对我来说,如果没有列受到影响会更有意义。
例子
这是一个使用函数计算变量均值的简单示例 y
。传递分组变量适用于 group_by_at()
,但不适用于 across()
,如下所示:
my_df <- tibble("x" = c("a", "a", "b", "b"), y = 1:4)
compute_mean1 <- function(df, grouping) { # compute grouped mean with across()
df %>%
group_by(across(all_of(grouping))) %>%
summarise(y = mean(y), .groups = "drop")
}
compute_mean2 <- function(df, grouping) { # compute grouped mean with group_by_at()
df %>%
group_by_at(grouping) %>%
summarise(y = mean(y), .groups = "drop")
}
compute_mean1(my_df, "x")
#> # A tibble: 2 x 2
#> x y
#> <chr> <dbl>
#> 1 a 1.5
#> 2 b 3.5
compute_mean1(my_df, NULL)
#> Error: `vars` must be a character vector.
compute_mean2(my_df, "x")
#> # A tibble: 2 x 2
#> x y
#> <chr> <dbl>
#> 1 a 1.5
#> 2 b 3.5
compute_mean2(my_df, NULL)
#> # A tibble: 1 x 1
#> y
#> <dbl>
#> 1 2.5
由 reprex package (v0.3.0)
于 2020 年 7 月 14 日创建
像这样使用.add=TRUE
:
compute_mean3 <- function(df, grouping) { # compute grouped mean with across()
df %>%
group_by(across(all_of(grouping)), .add = TRUE) %>%
summarise(y = mean(y), .groups = "drop")
}
问题:
我想以编程方式使用 across()
NULL
或空字符串传递给它,函数不会失败。这可能使用了函数的作用域变体,例如 group_by_at()
,但我想让它使用 across()
.
另请注意,如果留空,目前 across()
将影响所有列。我不确定这样做的动机是什么;对我来说,如果没有列受到影响会更有意义。
例子
这是一个使用函数计算变量均值的简单示例 y
。传递分组变量适用于 group_by_at()
,但不适用于 across()
,如下所示:
my_df <- tibble("x" = c("a", "a", "b", "b"), y = 1:4)
compute_mean1 <- function(df, grouping) { # compute grouped mean with across()
df %>%
group_by(across(all_of(grouping))) %>%
summarise(y = mean(y), .groups = "drop")
}
compute_mean2 <- function(df, grouping) { # compute grouped mean with group_by_at()
df %>%
group_by_at(grouping) %>%
summarise(y = mean(y), .groups = "drop")
}
compute_mean1(my_df, "x")
#> # A tibble: 2 x 2
#> x y
#> <chr> <dbl>
#> 1 a 1.5
#> 2 b 3.5
compute_mean1(my_df, NULL)
#> Error: `vars` must be a character vector.
compute_mean2(my_df, "x")
#> # A tibble: 2 x 2
#> x y
#> <chr> <dbl>
#> 1 a 1.5
#> 2 b 3.5
compute_mean2(my_df, NULL)
#> # A tibble: 1 x 1
#> y
#> <dbl>
#> 1 2.5
由 reprex package (v0.3.0)
于 2020 年 7 月 14 日创建像这样使用.add=TRUE
:
compute_mean3 <- function(df, grouping) { # compute grouped mean with across()
df %>%
group_by(across(all_of(grouping)), .add = TRUE) %>%
summarise(y = mean(y), .groups = "drop")
}