tidyr 稍后在函数中使用胶水字符串
tidyr use glue strings later in function
Tidy eval now supports glue strings
所以效果很好:
my_summarise5 <- function(data, mean_var ) {
data %>%
mutate(
"mean_{{mean_var}}" := mean({{ mean_var }}),
)
}
mtcars %>% my_summarise5(cyl)
但是后来
my_summarise5 <- function(data, mean_var ) {
data %>%
mutate(
"mean_{{mean_var}}" := mean({{ mean_var }}),
"mean_{{mean_var}}_plusone" := "mean_{{mean_var}}"+1
)
}
mtcars %>% my_summarise5(cyl)
投掷
Error: Problem with `mutate()` input `mean_cyl_plusone`.
x non-numeric argument to binary
"mean_{{mean_var}}_plusone" := "mean_{{mean_var}}"+1
部分中的某些 'paste' 或 'glue' 可以解决这个问题吗?
请注意,这显然不是一个有用的案例,它是语法的 MWE。我实际上想定义两个具有不同名称的新列,一个使用另一个......否则我必须重复并且它也会变得混乱。
跨越使用:
my_summarise5 <- function(data, mean_var ) {
data %>%
mutate(
"mean_{{mean_var}}" := mean({{ mean_var }}),
across(last_col(), ~.+1, .names = "{col}_plusone")
)
}
mtcars %>% my_summarise5(cyl) %>% head
给予:
mpg cyl disp hp drat wt qsec vs am gear carb mean_cyl mean_cyl_plusone
Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4 6.1875 7.1875
Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4 6.1875 7.1875
Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1 6.1875 7.1875
Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1 6.1875 7.1875
Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2 6.1875 7.1875
Valiant 18.1 6 225 105 2.76 3.460 20.22 1 0 3 1 6.1875 7.1875
我喜欢 tidyverse,但是使用 base R 可以让你的代码变得可读和可维护,从而获得很大的回报。
my_summarise5 <- function (data, mean_var) {
mean_name <- paste0("mean_", mean_var)
plus_one_name <- paste0(mean_name, "_plus_one")
data[[mean_name]] <- mean(data[[mean_var]])
data[[plus_one_name]] <- data[[mean_name]] + 1
data
}
懂R的人都能看懂上面的内容
tmp <- data.frame(a = 1:5)
my_summarise5(tmp, "a")
## a mean_a mean_a_plus_one
## 1 1 3 4
## 2 2 3 4
## 3 3 3 4
## 4 4 3 4
## 5 5 3 4
如果你想传递一个裸符号作为mean_var
,那么只需将这行添加到函数的开头:
mean_var <- as.character(substitute(mean_var))
这并不完美,因为它会破坏深度嵌套的函数。所以你可以通过做(类似)mean_var <- enquo(mean_var)
来混合一点 tidyverse。但我仍然更喜欢简单的数据操作而不是 mutate
和 across
.
Tidy eval now supports glue strings
所以效果很好:
my_summarise5 <- function(data, mean_var ) {
data %>%
mutate(
"mean_{{mean_var}}" := mean({{ mean_var }}),
)
}
mtcars %>% my_summarise5(cyl)
但是后来
my_summarise5 <- function(data, mean_var ) {
data %>%
mutate(
"mean_{{mean_var}}" := mean({{ mean_var }}),
"mean_{{mean_var}}_plusone" := "mean_{{mean_var}}"+1
)
}
mtcars %>% my_summarise5(cyl)
投掷
Error: Problem with `mutate()` input `mean_cyl_plusone`.
x non-numeric argument to binary
"mean_{{mean_var}}_plusone" := "mean_{{mean_var}}"+1
部分中的某些 'paste' 或 'glue' 可以解决这个问题吗?
请注意,这显然不是一个有用的案例,它是语法的 MWE。我实际上想定义两个具有不同名称的新列,一个使用另一个......否则我必须重复并且它也会变得混乱。
跨越使用:
my_summarise5 <- function(data, mean_var ) {
data %>%
mutate(
"mean_{{mean_var}}" := mean({{ mean_var }}),
across(last_col(), ~.+1, .names = "{col}_plusone")
)
}
mtcars %>% my_summarise5(cyl) %>% head
给予:
mpg cyl disp hp drat wt qsec vs am gear carb mean_cyl mean_cyl_plusone
Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4 6.1875 7.1875
Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4 6.1875 7.1875
Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1 6.1875 7.1875
Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1 6.1875 7.1875
Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2 6.1875 7.1875
Valiant 18.1 6 225 105 2.76 3.460 20.22 1 0 3 1 6.1875 7.1875
我喜欢 tidyverse,但是使用 base R 可以让你的代码变得可读和可维护,从而获得很大的回报。
my_summarise5 <- function (data, mean_var) {
mean_name <- paste0("mean_", mean_var)
plus_one_name <- paste0(mean_name, "_plus_one")
data[[mean_name]] <- mean(data[[mean_var]])
data[[plus_one_name]] <- data[[mean_name]] + 1
data
}
懂R的人都能看懂上面的内容
tmp <- data.frame(a = 1:5)
my_summarise5(tmp, "a")
## a mean_a mean_a_plus_one
## 1 1 3 4
## 2 2 3 4
## 3 3 3 4
## 4 4 3 4
## 5 5 3 4
如果你想传递一个裸符号作为mean_var
,那么只需将这行添加到函数的开头:
mean_var <- as.character(substitute(mean_var))
这并不完美,因为它会破坏深度嵌套的函数。所以你可以通过做(类似)mean_var <- enquo(mean_var)
来混合一点 tidyverse。但我仍然更喜欢简单的数据操作而不是 mutate
和 across
.