具有从输入数据生成的美学的 ggplot

ggplot with aesthetics generated from input data

因为我需要在 R 中制作很多不同的图,所以我试图在准备数据时加入更多的逻辑(添加与美学相对应的列名),并在图本身中加入更少的逻辑。

考虑以下默认虹膜图:

library(ggplot2)
library(data.table)
scatter <- ggplot(data=iris, aes(x = Sepal.Length, y = Sepal.Width)) 
scatter + geom_point(aes(color=Species, shape=Species))

现在我修改了 iris 数据,其列名与所需的美学相匹配:

iris2 <- as.data.table(iris)
iris2 <- iris2[,.(x=Sepal.Length, y=Sepal.Width, color=Species,
                  shape=Species)]

我想以这样一种方式绘制函数,它基本上构建了以下命令,只是稍微更动态一点,因此您可以使用数据中提供的所有美学。

ggplot(data, aes(x=x, y=y)) + geom_point(aes(color=color, shape=shape))

我已经有很长时间没有阅读任何关于非标准评估、表达式和引用的内容,并且我注意到 rlang and quosures (cheatsheet) 有相当多的发展。 [这个]问题有点帮助,但它没有解决我想从数据中推断美学的事实。

最后我尝试了很多东西,并查看了aes。在那里我看到:

exprs <- rlang::enquos(x = x, y = y, ...)

我认为这就是我所做的所有尝试的原因:

ggplot(iris2, aes(x=x, y=y)) +
    geom_point(aes(rlang::quo(expr(color=color))))

没有成功,因为 aes 正在尝试 'enquos' 我的问题。

问题有没有什么方法可以根据数据的内容以动态方式向 aes 提供参数(所以你事先不知道你需要哪种美学?

如果我的问题不够清楚,最后我做了一些有用的东西,只是我觉得这完全没有必要,因为我没有know/understand正确的做法。因此,下面的内容有效并且是我的想法,但是我例如不喜欢的是我必须修改 aes:

下面的块是独立的,可以在没有上面的代码块的情况下执行。

library(data.table)
library(ggplot2)
library(rlang)
iris2 <- as.data.table(iris)
iris2 <- iris2[,.(x=Sepal.Length, y=Sepal.Width, color=Species, shape=Species)]
myaes <- function (x, y, myquo=NULL, ...) {    
    exprs <- rlang::enquos(x = x, y = y, ...)    
    exprs <- c(exprs, myquo)
    is_missing <- vapply(exprs, rlang::quo_is_missing, logical(1))
    aes <- ggplot2:::new_aes(exprs[!is_missing], env = parent.frame())
    ggplot2:::rename_aes(aes)
}

generalPlot <- function(data, f=geom_point,
                        knownaes=c('color'=expr(color), 'shape'=expr(shape))){
    myquo  <- list()
    for(i in names(knownaes)){
        if(i %in% names(data)){
            l <- list(rlang::quo(!!knownaes[[i]]))
            names(l) <- i
            myquo <- c(myquo, l)
        }
    }    

    ggplot(data, aes(x=x, y=y)) +
        f(myaes(myquo=myquo))   
}

generalPlot(iris2[,.(x, y, color)])
generalPlot(iris2[,.(x, y, color, shape)])

因此,如果您的数据是 "color" 或 "shape" 列,您只想将其映射到颜色或形状美学上?我认为更简单的方法是

generalPlot <- function(data, f=geom_point, knownaes=c('color', 'shape')) {
  match_aes <- intersect(names(data), knownaes)
  my_aes_list <- purrr::set_names(purrr::map(match_aes, rlang::sym), match_aes)
  my_aes <- rlang::eval_tidy(quo(aes(!!!my_aes_list)))
  ggplot(data, aes(x=x, y=y)) +
        f(mapping=my_aes)

}

那你可以做

generalPlot(iris2[,.(x, y)])
generalPlot(iris2[,.(x, y, color)])
generalPlot(iris2[,.(x, y, color, shape)])

并且它不需要额外的 myaes 功能。

我有点惊讶我不得不使用 eval_tidy 但由于某些原因你似乎无法将 !!!aes() 一起使用。

x <- list(color=sym("color"))
ggplot(iris2, aes(x,y)) + geom_point(aes(!!!x))
# Error: Can't use `!!!` at top level

(使用 ggplot2_3.1.0 测试)

您可以使用此自定义函数来解析输入数据列名并生成传递给 eval()aes 文本字符串。

generateAES <- function(foo) {
    eval(parse(text = paste0("aes(", 
        paste(
            lapply(foo, function(i) paste(i, "=", i)), 
        collapse = ","), 
        ")"
    )))
}

您可以将其用于:

ggplot(iris2, generateAES(colnames(iris2))) +
    geom_point()

或者用管道:

library(magrittr)
iris2 %>%
    ggplot(generateAES(colnames(.))) +
        geom_point()

generateAES 输出是 aes 像:

Aesthetic mapping: 
* `x`      -> `x`
* `y`      -> `y`
* `colour` -> `color`
* `shape`  -> `shape`

从文本字符串生成"aes(x = x,y = y,color = color,shape = shape)"