ggplot循环绘制具有匹配前缀但不同后缀的列

ggplot loop graphing columns with matching prefix but different suffix

我有一个大型数据框,其中每一列都包含高、低和高-低。我还有一个基本列。我想为每组前缀创建一个图表,以便折线图具有 A_H、A_L、A_HL 和 Base,然后所有其他匹配的前缀都相同.

date     A_H B_H C_H D_H A_L B_L C_L D_L A_HL B_HL C_HL D_HL Base
2/1/18    6   4   6   4   2   3   5   8   9    2    3    5    3
2/2/18    2   4   7   6   5   8   3   9   11   12   5    9    5
2/3/18    8   6   8   9   6   9   7   9   13   13   6    7    5

我尝试了多种方法,但它们都不起作用。

GraphList <- c("A", "B", "C", "D")
for (i in seq_along(GraphList)){
    plot <- ggplot(df, aes(date)) +
        geom_line(aes(y=Base, colour='Base')) +
        geom_line(aes(y=paste0(i,"High"), colour='High')) +
        geom_line(aes(y=paste0(i,"Low"), colour='Low')) +
        geom_line(aes(y=paste0(i,"LS"), colour='LS')) 
    print(plot)

但是当我执行上面的操作时,图表不会粘贴列表中的名称前缀,它只是在各自的图表中吐出 1H 和 1L、2H 和 2L 等作为扁平线。

我也试过了

plot <- ggplot(df, aes(date)) +
        geom_line(aes(y=Base, colour='Base')) +
        geom_line(aes(y=df[, grepl("_H", colnames(df))], colour='High')) +
        geom_line(aes(y=df[, grepl("_L", colnames(df))], colour='Low')) +
        geom_line(aes(y=df[, grepl("_LS", colnames(df))], colour='LS')) 
    print(plot)

使用这个方法我得到了错误

Don't know how to automatically pick the scale for object of type tbl_df/tbl/data.frame. Defaulting to continuous

Error: aesthetics must be either length 1 or the same as the data (63): y, colour, x

提前致谢。

首先,如果数据被重塑为 "long" 格式,我们可以让 ggplot 为我们做很多工作:

df <- read.table(text = 'date     A_H B_H C_H D_H A_L B_L C_L D_L A_HL B_HL C_HL D_HL Base
2/1/18    6   4   6   4   2   3   5   8   9    2    3    5    3
                 2/2/18    2   4   7   6   5   8   3   9   11   12   5    9    5
                 2/3/18    8   6   8   9   6   9   7   9   13   13   6    7    5', header = T, stringsAsFactors = F)

library(tidyverse)
library(lubridate)

df.long <- df %>% 
  tidyr::gather(variable, value, -date, -Base) %>% 
  separate(variable, into = c('variable', 'measure'), sep = '_') %>% 
  mutate(date = mdy(date))

         date Base variable measure value
1  2018-02-01    3        A       H     6
2  2018-02-02    5        A       H     2
3  2018-02-03    5        A       H     8
4  2018-02-01    3        B       H     4
5  2018-02-02    5        B       H     4
6  2018-02-03    5        B       H     6
7  2018-02-01    3        C       H     6
8  2018-02-02    5        C       H     7
9  2018-02-03    5        C       H     8
10 2018-02-01    3        D       H     4

df.long 将 "Base" 移动到它自己的列中,其值在 "variable"(A、B、C、D)和 "measure"( H、L、HL)。我还将 "date" 列转换为正确的日期数据,这将再次允许 ggplot 为我们做更多的工作。

首先,我们可以将所有这些都放在一个多面图中:

g <- ggplot(data = df.long, aes(x = date, y = value, color = measure)) +
  geom_line() +
  geom_line(aes(y = Base), color = 'black') +
  facet_grid(facets = ~variable)
print(g)

或者我们可以使用循环来创建几个单独的绘图对象:

plots <- list()
for (i in unique(df.long$variable)) {
  plots[[i]] <- ggplot(data = filter(df.long, variable == i), aes(x = date, y = value, color = measure)) +
    geom_line() +
    geom_line(aes(y = Base), color = 'black')
}

plots[[1]]