R中的聚集(分组)条形图中的gghighlight

gghighlight in clustered (grouped) bar chart in R

我需要在 R 中的 集群 条形图中使用 gghighlight 以便仅突出显示一个条形。我的代码和示例数据如下所示:

library(tidyr)
library(ggplot2)
dat <- data.frame(country=c('USA','Brazil','Ghana','England','Australia'), Stabbing=c(15,10,9,6,7), Accidents=c(20,25,21,28,15), Suicide=c(3,10,7,8,6))
dat.m <- melt(dat, id.vars='country')
dat.g <- gather(dat, type, value, -country)
ggplot(dat.g, aes(type, value)) + 
  geom_bar(aes(fill = country), stat = "identity", position = "dodge") +
  gghighlight(type == "Accidents" & country == "Brazil")

但这让我很尴尬

如何让 gghighlight 仅突出显示 one 组中的一个条形图(因此结合两个离散变量的两个条件)?

我认为 gghighlight 不是为这种情节而构建的 - 还不是!您可以提出功能请求吗?不过,这种可视化是否很有帮助还不清楚。 Gghighlight 总是绘制所有东西 - 这使得 "weird" 躲避时有阴影。

如果您想继续使用 gghightlight,也许可以尝试 faceting,他们在 their vignette

中建议

一个建议 - 使用构面:

(以mtcars为例)

library(tidyverse)
library(gghighlight)

mtcars2 <- mtcars %>% mutate(cyl = as.character(cyl), gear = as.character(gear))
ggplot(mtcars2, aes(cyl, disp, fill = gear))  +
  geom_col() + #no dodge
  gghighlight(cyl == "4") + #only one variable
  facet_grid(~ gear) #the other variable is here
#> Warning: Tried to calculate with group_by(), but the calculation failed.
#> Falling back to ungrouped filter operation...

reprex package (v0.3.0)

于 2020-03-09 创建

或者,这里没有 gghighlight,采用更传统的子集方法。 您需要制作一个数据子集,其中包含您要躲避的每个组的行,在本例中为 "cyl" 和 "gear"。我把不相关的数据替换成"NA",你也可以用“0”。

library(tidyverse)

mtcars2 <- mtcars %>% 
  mutate(cyl = as.character(cyl), gear = as.character(gear)) %>% 
  group_by(cyl, gear) %>% 
  summarise(disp = mean(disp))

subset_mt <- mtcars2 %>% mutate(highlight = if_else(cyl == '4' & gear == '3', disp, NA_real_))

ggplot()  +
  geom_col(data = mtcars2, aes(cyl, disp, group = gear), fill = 'grey', alpha = 0.6, position = 'dodge') +
  geom_col(data = subset_mt, aes(cyl, highlight, fill = gear), position = 'dodge') 
#> Warning: Removed 7 rows containing missing values (geom_col).

reprex package (v0.3.0)

于 2020 年 3 月 10 日创建

以下是在此类图中突出显示单个列的两个替代选项:

1) 创建一个新变量(下面命名为 highlight)并用它填充(并且,如果你愿意,可以使用线条颜色按国家/地区着色)

2) 用箭头 and/or 文本手动注释要突出显示的一列(或弄清楚如何自动定位,但这会更复杂)- 可能是最后一个选项图

library(tidyr)
library(ggplot2)
dat <- data.frame(country=c('USA','Brazil','Ghana','England','Australia'), 
    Stabbing=c(15,10,9,6,7), 
    Accidents=c(20,25,21,28,15), Suicide=c(3,10,7,8,6))
dat.m <- reshape2::melt(dat, id.vars='country')
dat.g <- gather(dat, type, value, -country)

## set highlighted bar
dat.g$highlight <- ifelse(dat.g$type == "Accidents" & dat.g$country == "Brazil", TRUE, FALSE)

## option 1: use fill to highlight, colour for country
ggplot(dat.g, aes(type, value, fill = highlight, colour=country), alpha=.6) + 
    geom_bar(stat = "identity", position = "dodge2", size=1) +
    scale_fill_manual(values = c("grey20", "red"))+
    guides(fill = FALSE) + 

    ## option 2: use annotate to manually label a specific column:
    annotate(geom = "curve", x = 1.15, y = 30, xend = 1.35, yend = 26, 
        curvature = .2, arrow = arrow(length = unit(2, "mm"))) +
    annotate(geom = "text", x = 1, y = 31, label = "Highlight", hjust = "left")

reprex package (v0.3.0)

于 2020 年 3 月 10 日创建