使用 ggplot 和 facet_grid 指定误差线
specify error bars with ggplot and facet_grid
我用 facet_grid
制作了一个图表,以可视化每天每个治疗组中锂的百分比。
library(ggplot2)
library(Rmisc)
library(plyr)
mus2 <- summarySE(mus, measurevar="litium",
groupvars=c("treatment", "group", "day"), na.rm = TRUE)
mus2
mus3 <- mus2
mus3$group <- factor(mus3$group)
ms.chl<- ggplot(mus3, aes(x=group, y=litium, fill=treatment)) +
geom_bar(stat="identity", colour="black") + facet_grid(~day) + theme_bw()
ms.chl
结果是:
为此我有两个问题:
我无法为每个组的锂含量制作正确的误差线。我试过这个,但每次治疗我只得到错误栏。
ms.chl + geom_errorbar(aes(ymin=litium-se, ymax=litium+se), size=0.5,
width=.25,
position=position_dodge(.9)) +
facet_grid(~day)
我想要每组总数的误差线
然后,我的第二个问题是:是否可以表示每个组的绝对值和每个处理的百分比?
数据集(亩):
litium group treatment day
0.009439528 1 Control day1
0.005115057 1 Control day1
0.009742297 1 Control day1
0.016515625 2 Control day1
0.01074537 2 Control day1
0.016300836 2 Control day1
0.009538339 3 Control day1
0.010609746 3 Control day1
0.008928012 3 Control day1
0.009425325 1 Control + bird day1
0.00561831 1 Control + bird day1
0.014622517 1 Control + bird day1
0.017702439 2 Control + bird day1
0.010545045 2 Control + bird day1
0.029109907 2 Control + bird day1
0.013737568 3 Control + bird day1
0.015174405 3 Control + bird day1
0.014583832 3 Control + bird day1
0.009244079 1 Control day2
0.006591033 1 Control day2
0.007592587 1 Control day2
0.013676745 2 Control day2
0.016208676 2 Control day2
0.017593952 2 Control day2
0.014003037 3 Control day2
0.01163581 3 Control day2
0.011643067 3 Control day2
0.009229506 1 Control + bird day2
0.006423714 1 Control + bird day2
0.008653163 1 Control + bird day2
0.012441379 2 Control + bird day2
0.0204346 2 Control + bird day2
0.010017788 2 Control + bird day2
0.009745063 3 Control + bird day2
0.00967963 3 Control + bird day2
0.010291306 3 Control + bird day2
0.009466604 1 Fence day2
0.019611081 2 Fence day2
0.006796444 2 Fence day2
0.018928695 2 Fence day2
0.007787736 3 Fence day2
0.009409897 3 Fence day2
第一个也是最简单的解决方案是使您的条形图并排而不是堆叠。那么您唯一需要在代码中更改的是将 position="dodge"
添加到 geom_bar()
和 运行 其余代码。这样做的额外好处是能够直接比较不同条的高度,避免将误差条放在条的中间。
ms.chl<- ggplot(mus3, aes(x=group, y=litium, fill=treatment)) +
geom_bar(stat="identity", colour="black",position="dodge") +
facet_grid(~day) + theme_bw()
ms.chl + geom_errorbar(aes(ymin=litium-se, ymax=litium+se), size=0.5,
width=.25,position=position_dodge(.9)) +
facet_grid(~day)
要在堆积条形图上添加误差条,您必须确保条形以 litium
的累积和为中心。为此,您可以在 ave()
:
cumsum()
mus3 <- within(mus3,lit2 <- ave(litium,group,day,FUN=cumsum))
然后在召唤geom_errorbar()
时使用lit2
而不是litium
并且不要闪避
ms.chl<- ggplot(mus3, aes(x=group, y=litium, fill=treatment)) +
geom_bar(stat="identity", colour="black") + facet_grid(~day) + theme_bw()
ms.chl + geom_errorbar(aes(ymin=lit2-se, ymax=lit2+se), size=0.5,
width=.25) + facet_grid(~day)
如果您只想要该组的误差线,那么您必须获得整个组的误差,而不是治疗组内的误差,但您不能直接将其添加到基于整个组,因为这些是均值并且堆叠条形图具有均值之和,因此您必须对 mus3
.
musgroup <- summarySE(mus, measurevar="litium",
groupvars=c("group", "day"), na.rm = TRUE)
musgroupsum <- ddply(mus3,.(group,day),summarize,lit2 = sum(litium))
mus4 <- merge(musgroup,musgroupsum)
ms.chl<- ggplot() +
geom_bar(data=mus3, aes(x=group, y=litium, fill=treatment),
stat="identity", colour="black") + facet_grid(~day) + theme_bw()
ms.chl + geom_errorbar(data=mus4,aes(x=group,ymin=lit2-se, ymax=lit2+se),
size=0.5, width=.25)
不过,在这一点上,它开始变得有点荒谬了。堆叠均值不是组均值——它们是组均值的总和,但误差是针对组均值的。当您查看该图时,误差条相对于它们所代表的平均值似乎更小,因为它们的中心位置比它们应该的位置高得多。看起来您正在寻找的是组均值的表示,它允许您查看每种处理对该组均值的贡献。显示这一点的一种方法是缩放条形图大小,以便累积总和以每个组的正确平均值为中心。
mus3 <- within(mus3,lit3 <- ave(litium,group,day,FUN=function(x) x/length(x)))
ms.chl<- ggplot() +
geom_bar(data=mus3, aes(x=group, y=lit3, fill=treatment),
stat="identity", colour="black") + facet_grid(~day) +
theme_bw() + ylab("litium")
ms.chl + geom_errorbar(data=mus4,aes(x=group,ymin=litium-se, ymax=litium+se),
size=0.5,width=.25)