使用百分比创建马赛克图

Creating a mosaic plot with percentages

以下是我拥有的示例数据集:

df <- structure(list(Class = c("A", "B", "C", "D"), 
`Attempted` = c(374, 820, 31, 108), 
`Missed` = c(291, 311, 5, 15), 
`Cancelled` = c(330, 206, 6, 5), 
`Unknown` = c(950, 341, 6, 13)), 
class = "data.frame", row.names = c(NA, -4L))

我想用 'percentages' 而不是绝对数字来创建马赛克图。准确地说,我想看看 'class A' 人在总 'class A' 人口 'missed' 中所占的百分比是多少?并且,对于其他 class 人口也是如此。

我还没有尝试过任何代码,因为我完全不知道如何开始。谁能帮我解决这个问题?

只使用一个包,你可以做并注意我用每个 class 中的比例标记单元格(即行总和为 1):

library(vcd)
M = as.table(as.matrix(df[,-1]))
names(dimnames(M)) = c("Class","result")
labs <- round(prop.table(M,margin=1), 2)
mosaic(M, pop = FALSE)
labeling_cells(text = labs, margin = 0)(M)

您也可以用简单的方法将其可视化

library(RColorBrewer)
barplot(t(labs),col=brewer.pal(4,"Set2"))

legend("bottomright",legend = colnames(labs),inset=c(0,1.1), xpd=TRUE, 
       fill =brewer.pal(4,"Set2"),horiz=TRUE,cex=0.7)

如果你使用 ggplot2 和其他 gg 东西,你需要将你的数据转长:

library(tidyr)
library(dplyr)
library(ggplot2)

df_long = df %>% 
pivot_longer(-Class) %>% 
group_by(Class) %>% 
mutate(total = sum(value),
       p = round(100*value/total,digits=1)) %>%
ungroup()

ggplot(df_long,aes(x=Class,y=p,fill=name)) + geom_col() + geom_text(aes(label=p),position=position_stack(vjust=0.2))

如果你想使用 ggplot2,你需要修改这个 answer by z.lin,注意我使用 sqrt 使较小的图更明显:

ggplot(df_long,
       aes(x = Class, y = p, width = sqrt(total), fill = name)) +
geom_col(colour = "black") +
geom_text(aes(label = p), position = position_stack(vjust = 0.5)) + 
facet_grid(~Class, scales = "free_x", space = "free_x") +
theme_void()