R - 如何将屏幕 space 分配给复杂的 ggplot 图像

R - how to allocate screen space to complex ggplot images

我正在尝试编写一个脚本,在单个图像中生成四个不同的图。具体来说,我想尽可能地重新创建此图形:

我当前的脚本生成了四个与这些类似的图,但我不知道如何相应地分配屏幕空间。我想:

  1. 修改地块的高度和宽度,使四个地块的宽度统一,其中一个明显高于其他高度相同的地块
  2. 通过坐标定义图例的位置,以便我可以有效地使用屏幕 space
  3. 根据需要明确修改图像的整体形状(也许在某些时候我需要它更接近方形)

生成一些要绘制的数据

pt_id = c(1:279) # DEFINE PATIENT IDs
smoke = rbinom(279,1,0.5) # DEFINE SMOKING STATUS
hpv = rbinom(279,1,0.3) # DEFINE HPV STATUS
data = data.frame(pt_id, smoke, hpv) # PRODUCE DATA FRAME

添加解剖部位数据

data$site = sample(1:4, 279, replace = T)
data$site[data$site == 1] = "Hypopharynx"
data$site[data$site == 2] = "Larynx"
data$site[data$site == 3] = "Oral Cavity"
data$site[data$site == 4] = "Oropharynx"
data$site_known = 1  # HACK TO FACILITATE PRODUCING BARPLOTS

添加突变频率数据

data$freq = sample(1:1000, 279, replace = F)

定义条形图

require(ggplot2)
require(gridExtra)
bar = ggplot(data, aes(x = pt_id, y = freq)) + geom_bar(stat = "identity") +     theme(axis.title.x = element_blank(), axis.ticks.x = element_blank(), axis.text.x = element_blank()) + ylab("Number of Mutations")
# DEFINE BINARY PLOTS
smoke_status = ggplot(data, aes(x=pt_id, y=smoke, fill = "red")) + geom_bar(stat="identity") + theme(legend.position = "none", axis.title.x = element_blank(), axis.ticks.x = element_blank(), axis.text.x = element_blank()) + ylab("Smoking Status")
hpv_status = ggplot(data, aes(x=pt_id, y = hpv, fill = "red")) + geom_bar(stat="identity") + theme(legend.position = "none", axis.title.x = element_blank(), axis.ticks.x = element_blank(), axis.text.x = element_blank()) + ylab("HPV Status")
site_status = ggplot(data, aes(x=pt_id, y=site_known, fill = site)) +     geom_bar(stat="identity")

一起制作四张图

grid.arrange(bar, smoke_status, hpv_status, site_status, nrow = 4)

我怀疑完成这些任务所需的功能已经包含在 ggplot2 和 gridExtra 中,但我一直无法弄清楚如何。此外,如果我的任何代码过于冗长,或者有更简单、更优雅的方法来完成我已经完成的工作——也请随时对此发表评论。

以下是获取您描述的布局的步骤:

1) 将图例提取为单独的 grob ("graphical object")。 然后我们可以将图例与绘图分开布置。

2) 将四个图的边缘左对齐,以便左边缘和 x 尺度正确对齐。执行此操作的代码来自 this SO answer。该答案具有对齐任意数量的图的功能,但是当我还想更改分配给每个图的比例 space 时,我无法让它工作,所以我最终做到了 "long way" 通过分别调整每个图。

3) 使用 grid.arrangearrangeGrob 布置图和图例。 heights 参数分配总数的不同比例每个地块垂直 space。我们还使用 widths 参数将水平 space 分配给一个宽列中的图和另一个窄列中的图例。

4) 绘制到您想要的任何尺寸的设备。 这就是您获得特定形状或纵横比的方式。

library(gridExtra)
library(grid)

# Function to extract the legend from a ggplot graph as a separate grob
# Source: 
get_leg = function(a.gplot){
  tmp <- ggplot_gtable(ggplot_build(a.gplot))
  leg <- which(sapply(tmp$grobs, function(x) x$name) == "guide-box")
  legend <- tmp$grobs[[leg]]
  legend
}

# Get legend as a separate grob
leg = get_leg(site_status)

# Add a theme element to change the plot margins to remove white space between the plots
thm = theme(plot.margin=unit(c(0,0,-0.5,0),"lines"))

# Left-align the four plots 
# Adapted from: 
gA <- ggplotGrob(bar + thm)
gB <- ggplotGrob(smoke_status + thm)
gC <- ggplotGrob(hpv_status + thm)
gD <- ggplotGrob(site_status + theme(plot.margin=unit(c(0,0,0,0), "lines")) + 
                  guides(fill=FALSE))

maxWidth = grid::unit.pmax(gA$widths[2:5], gB$widths[2:5], gC$widths[2:5], gD$widths[2:5])
gA$widths[2:5] <- as.list(maxWidth)
gB$widths[2:5] <- as.list(maxWidth)
gC$widths[2:5] <- as.list(maxWidth)
gD$widths[2:5] <- as.list(maxWidth)

# Lay out plots and legend
p = grid.arrange(arrangeGrob(gA,gB,gC,gD, heights=c(0.5,0.15,0.15,0.21)),
                 leg, ncol=2, widths=c(0.8,0.2))

然后您可以通过设置输出设备的参数来确定最终绘图的形状或纵横比。 (您可能需要在创建底层绘图时调整字体大小,以使最终布局看起来像您想要的那样。)下面粘贴的绘图是直接从 RStudio 图 window 保存的 png。以下是将绘图保存为 PDF 文件的方法(但还有许多其他 "devices" 您可以使用(例如 png、jpeg 等)以不同格式保存):

pdf("myPlot.pdf", width=10, height=5)
p
dev.off()

您还询问了更高效的代码。您可以做的一件事是创建一个您多次使用的绘图元素列表,然后只需将列表对象的名称添加到每个绘图。例如:

my_gg = list(geom_bar(stat="identity", fill="red"),
             theme(legend.position = "none", 
                   axis.title.x = element_blank(), 
                   axis.ticks.x = element_blank(), 
                   axis.text.x = element_blank()),
                   plot.margin = unit(c(0,0,-0.5,0), "lines"))

smoke_status = ggplot(data, aes(x=pt_id, y=smoke)) + 
                  labs(y="Smoking Status") +
                  my_gg