ggplot2 密度直方图,宽度 =.5,vline 和中心条位置
ggplot2 density histogram with width=.5, vline and centered bar positions
我想要一些离散数据的良好密度(总和为 1)直方图。我已经尝试了几种方法来做到这一点,但 none 完全令人满意。
生成一些数据:
#data
set.seed(-999)
d.test = data.frame(score = round(rnorm(100,1)))
mean.score = mean(d.test[,1])
d1 = as.data.frame(prop.table(table(d.test)))
第一个给出了正确的条形放置——居中在数字的顶部——但是 vline()
的错误放置。这是因为 x 轴是离散的(因子),因此使用水平数而不是值绘制平均值。平均值为 .89.
ggplot(data=d1, aes(x=d.test, y=Freq)) +
geom_bar(stat="identity", width=.5) +
geom_vline(xintercept=mean.score, color="blue", linetype="dashed")
第二个给出了正确的 vline()
位置(因为 x 轴是连续的),但是错误的条形放置和 width
参数在 x 轴是时似乎不可修改连续()。我也试过 size
参数也没有效果。 hjust
.
同上
ggplot(d.test, aes(x=score)) +
geom_histogram(aes(y=..count../sum(..count..)), width=.5) +
geom_vline(xintercept=mean.score, color="blue", linetype="dashed")
有什么想法吗?我的坏主意是重新调整均值以使其适合因子水平并使用第一个解决方案。如果某些因子水平为 'missing',例如,这将无法正常工作。 1、2、4,没有 3 的因数,因为没有数据点具有该值。如果平均值为 3.5,则重新调整为 odd(x 轴不再是 interval scale)。
另一个想法是这样的:
ggplot(d.test, aes(x=score)) +
stat_bin(binwidth=.5, aes(y= ..density../sum(..density..)), hjust=-.5) +
scale_x_continuous(breaks = -2:5) + #add ticks back
geom_vline(xintercept=mean.score, color="blue", linetype="dashed")
但这需要调整断点,并且条形图仍然处于错误的位置(未居中)。不幸的是,hjust
似乎不起作用。
我怎样才能得到我想要的一切?
- 密度总和为 1
- 柱形居中高于值
vline()
在正确的数字
- 宽度=.5
有了基础图形,也许可以通过在 x 轴上绘制两次来解决这个问题。这里有类似的方法吗?
听起来您只是想确保您的 x 轴值是数字而不是因子
ggplot(data=d1, aes(x=as.numeric(as.character(d.test)), y=Freq)) +
geom_bar(stat="identity", width=.5) +
geom_vline(xintercept=mean.score, color="blue", linetype="dashed") +
scale_x_continuous(breaks=-2:3)
这给出了
我想要一些离散数据的良好密度(总和为 1)直方图。我已经尝试了几种方法来做到这一点,但 none 完全令人满意。
生成一些数据:
#data
set.seed(-999)
d.test = data.frame(score = round(rnorm(100,1)))
mean.score = mean(d.test[,1])
d1 = as.data.frame(prop.table(table(d.test)))
第一个给出了正确的条形放置——居中在数字的顶部——但是 vline()
的错误放置。这是因为 x 轴是离散的(因子),因此使用水平数而不是值绘制平均值。平均值为 .89.
ggplot(data=d1, aes(x=d.test, y=Freq)) +
geom_bar(stat="identity", width=.5) +
geom_vline(xintercept=mean.score, color="blue", linetype="dashed")
第二个给出了正确的 vline()
位置(因为 x 轴是连续的),但是错误的条形放置和 width
参数在 x 轴是时似乎不可修改连续(size
参数也没有效果。 hjust
.
ggplot(d.test, aes(x=score)) +
geom_histogram(aes(y=..count../sum(..count..)), width=.5) +
geom_vline(xintercept=mean.score, color="blue", linetype="dashed")
有什么想法吗?我的坏主意是重新调整均值以使其适合因子水平并使用第一个解决方案。如果某些因子水平为 'missing',例如,这将无法正常工作。 1、2、4,没有 3 的因数,因为没有数据点具有该值。如果平均值为 3.5,则重新调整为 odd(x 轴不再是 interval scale)。
另一个想法是这样的:
ggplot(d.test, aes(x=score)) +
stat_bin(binwidth=.5, aes(y= ..density../sum(..density..)), hjust=-.5) +
scale_x_continuous(breaks = -2:5) + #add ticks back
geom_vline(xintercept=mean.score, color="blue", linetype="dashed")
但这需要调整断点,并且条形图仍然处于错误的位置(未居中)。不幸的是,hjust
似乎不起作用。
我怎样才能得到我想要的一切?
- 密度总和为 1
- 柱形居中高于值
vline()
在正确的数字- 宽度=.5
有了基础图形,也许可以通过在 x 轴上绘制两次来解决这个问题。这里有类似的方法吗?
听起来您只是想确保您的 x 轴值是数字而不是因子
ggplot(data=d1, aes(x=as.numeric(as.character(d.test)), y=Freq)) +
geom_bar(stat="identity", width=.5) +
geom_vline(xintercept=mean.score, color="blue", linetype="dashed") +
scale_x_continuous(breaks=-2:3)
这给出了