R:在 dplyr 中使用字符串作为变异动词的参数

R: Using a string as an argument to mutate verb in dplyr

我正在构建一个闪亮的应用程序,它需要允许用户定义用于绘图的新变量。具体来说,我想允许用户定义要在 mutate verb 中使用的表达式。服务器接收文本形式的表达式,我想知道如何让 mutate 在 dplyr 0.7 中执行它。我可以使用 mutate_ 使其(部分)工作,但现在已弃用。它还将新列名定义为整个表达式而不是新变量

这是一个可重现的例子:

input_from_shiny <- "Petal.ratio = Petal.Length/Petal.Width"
iris_mutated <- iris %>% mutate_(input_from_shiny)

这给出了以下

> head(iris_mutated)
  Sepal.Length Sepal.Width Petal.Length Petal.Width Species Petal.ratio = Petal.Length/Petal.Width
1          5.1         3.5          1.4         0.2  setosa                                   7.00
2          4.9         3.0          1.4         0.2  setosa                                   7.00
3          4.7         3.2          1.3         0.2  setosa                                   6.50
4          4.6         3.1          1.5         0.2  setosa                                   7.50
5          5.0         3.6          1.4         0.2  setosa                                   7.00
6          5.4         3.9          1.7         0.4  setosa                                   4.25

从技术上讲,我可以使用正则表达式从字符串中提取新变量名称并相应地重命名新列,但我想知道使用最新的 dplyr 版本(正在阅读 https://cran.r-project.org/web/packages/dplyr/vignettes/programming.html, 但想不通)

我们可以使用 rlang::parse_quosure()!! (bang bang) 来产生相同的结果:

  • parse_quosure: 解析提供的字符串并将其转换为quosure

  • !!: 取消引号所以它可以被 tidyeval 动词计算

请注意,parse_quosure() 是 soft-deprecated,并根据其文档在 rlang 0.2.0 中重命名为 parse_quo()。如果我们使用 parse_quo(),我们需要为 quosures 指定环境,例如parse_quo(input_from_shiny, env = caller_env())

library(rlang)
library(tidyverse)

input_from_shiny <- "Petal.ratio = Petal.Length/Petal.Width"
iris_mutated <- iris %>% mutate_(input_from_shiny)

iris_mutated2 <- iris %>% 
  mutate(!!parse_quosure(input_from_shiny))
head(iris_mutated2)

#>   Sepal.Length Sepal.Width Petal.Length Petal.Width Species
#> 1          5.1         3.5          1.4         0.2  setosa
#> 2          4.9         3.0          1.4         0.2  setosa
#> 3          4.7         3.2          1.3         0.2  setosa
#> 4          4.6         3.1          1.5         0.2  setosa
#> 5          5.0         3.6          1.4         0.2  setosa
#> 6          5.4         3.9          1.7         0.4  setosa
#>   Petal.ratio = Petal.Length/Petal.Width
#> 1                                   7.00
#> 2                                   7.00
#> 3                                   6.50
#> 4                                   7.50
#> 5                                   7.00
#> 6                                   4.25


identical(iris_mutated, iris_mutated2)
#> [1] TRUE

编辑: 将 LHS 和 RHS 分开

lhs <- "Petal.ratio"
rhs <- "Petal.Length/Petal.Width"

iris_mutated3 <- iris %>% 
  mutate(!!lhs := !!parse_quosure(rhs))
head(iris_mutated3)

> head(iris_mutated3)
  Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1          5.1         3.5          1.4         0.2  setosa
2          4.9         3.0          1.4         0.2  setosa
3          4.7         3.2          1.3         0.2  setosa
4          4.6         3.1          1.5         0.2  setosa
5          5.0         3.6          1.4         0.2  setosa
6          5.4         3.9          1.7         0.4  setosa
  Petal.ratio
1        7.00
2        7.00
3        6.50
4        7.50
5        7.00
6        4.25

reprex package (v0.2.0) 创建于 2018-03-24。

Package friendlyeval 是一个简化的 tidy eval 接口,它试图在这些情况下让事情变得更直接。

将您的字符串一分为二,您将获得希望用作列名的字符串的一部分和希望用作表达式的字符串的一部分。所以你可以写:

library(friendlyeval)
library(dplyr)
lhs <- "Petal.ratio"
rhs <- "Petal.Length/Petal.Width"

iris_mutated3 <- 
  iris %>% 
  mutate(!!treat_string_as_col(lhs) := !!treat_string_as_expr(rhs))
head(iris_mutated3)

通过使用 lhs 上的函数,您可以检查 lhs 是否可以解析为普通列名。

friendlyeval 代码可以随时使用 RStudio 插件转换为简洁的评估代码。