使用百分比创建马赛克图
Creating a mosaic plot with percentages
以下是我拥有的示例数据集:
df <- structure(list(Class = c("A", "B", "C", "D"),
`Attempted` = c(374, 820, 31, 108),
`Missed` = c(291, 311, 5, 15),
`Cancelled` = c(330, 206, 6, 5),
`Unknown` = c(950, 341, 6, 13)),
class = "data.frame", row.names = c(NA, -4L))
我想用 'percentages' 而不是绝对数字来创建马赛克图。准确地说,我想看看 'class A' 人在总 'class A' 人口 'missed' 中所占的百分比是多少?并且,对于其他 class 人口也是如此。
我还没有尝试过任何代码,因为我完全不知道如何开始。谁能帮我解决这个问题?
只使用一个包,你可以做并注意我用每个 class 中的比例标记单元格(即行总和为 1):
library(vcd)
M = as.table(as.matrix(df[,-1]))
names(dimnames(M)) = c("Class","result")
labs <- round(prop.table(M,margin=1), 2)
mosaic(M, pop = FALSE)
labeling_cells(text = labs, margin = 0)(M)
您也可以用简单的方法将其可视化
library(RColorBrewer)
barplot(t(labs),col=brewer.pal(4,"Set2"))
legend("bottomright",legend = colnames(labs),inset=c(0,1.1), xpd=TRUE,
fill =brewer.pal(4,"Set2"),horiz=TRUE,cex=0.7)
如果你使用 ggplot2 和其他 gg 东西,你需要将你的数据转长:
library(tidyr)
library(dplyr)
library(ggplot2)
df_long = df %>%
pivot_longer(-Class) %>%
group_by(Class) %>%
mutate(total = sum(value),
p = round(100*value/total,digits=1)) %>%
ungroup()
ggplot(df_long,aes(x=Class,y=p,fill=name)) + geom_col() + geom_text(aes(label=p),position=position_stack(vjust=0.2))
如果你想使用 ggplot2,你需要修改这个 answer by z.lin,注意我使用 sqrt 使较小的图更明显:
ggplot(df_long,
aes(x = Class, y = p, width = sqrt(total), fill = name)) +
geom_col(colour = "black") +
geom_text(aes(label = p), position = position_stack(vjust = 0.5)) +
facet_grid(~Class, scales = "free_x", space = "free_x") +
theme_void()
以下是我拥有的示例数据集:
df <- structure(list(Class = c("A", "B", "C", "D"),
`Attempted` = c(374, 820, 31, 108),
`Missed` = c(291, 311, 5, 15),
`Cancelled` = c(330, 206, 6, 5),
`Unknown` = c(950, 341, 6, 13)),
class = "data.frame", row.names = c(NA, -4L))
我想用 'percentages' 而不是绝对数字来创建马赛克图。准确地说,我想看看 'class A' 人在总 'class A' 人口 'missed' 中所占的百分比是多少?并且,对于其他 class 人口也是如此。
我还没有尝试过任何代码,因为我完全不知道如何开始。谁能帮我解决这个问题?
只使用一个包,你可以做并注意我用每个 class 中的比例标记单元格(即行总和为 1):
library(vcd)
M = as.table(as.matrix(df[,-1]))
names(dimnames(M)) = c("Class","result")
labs <- round(prop.table(M,margin=1), 2)
mosaic(M, pop = FALSE)
labeling_cells(text = labs, margin = 0)(M)
您也可以用简单的方法将其可视化
library(RColorBrewer)
barplot(t(labs),col=brewer.pal(4,"Set2"))
legend("bottomright",legend = colnames(labs),inset=c(0,1.1), xpd=TRUE,
fill =brewer.pal(4,"Set2"),horiz=TRUE,cex=0.7)
如果你使用 ggplot2 和其他 gg 东西,你需要将你的数据转长:
library(tidyr)
library(dplyr)
library(ggplot2)
df_long = df %>%
pivot_longer(-Class) %>%
group_by(Class) %>%
mutate(total = sum(value),
p = round(100*value/total,digits=1)) %>%
ungroup()
ggplot(df_long,aes(x=Class,y=p,fill=name)) + geom_col() + geom_text(aes(label=p),position=position_stack(vjust=0.2))
如果你想使用 ggplot2,你需要修改这个 answer by z.lin,注意我使用 sqrt 使较小的图更明显:
ggplot(df_long,
aes(x = Class, y = p, width = sqrt(total), fill = name)) +
geom_col(colour = "black") +
geom_text(aes(label = p), position = position_stack(vjust = 0.5)) +
facet_grid(~Class, scales = "free_x", space = "free_x") +
theme_void()