gganimate 如何对一个有序的 bar time-series 进行排序?

How does gganimate order an ordered bar time-series?

我有一个 time-series 数据,我在 y-axis DIAG_RATE_65_PLUS 上绘制疾病的诊断率,并在 [=66= 上绘制用于比较的地理组] NAME作为一个简单的条形图。我的时间变量是 ACH_DATEyearmon,如标题所示,动画正在循环播放。

df %>% ggplot(aes(reorder(NAME, DIAG_RATE_65_PLUS), DIAG_RATE_65_PLUS)) +
  geom_bar(stat = "identity", alpha = 0.66) +
  labs(title='{closest_state}') +
  theme(plot.title = element_text(hjust = 1, size = 22),
        axis.text.x=element_blank()) +
  transition_states(ACH_DATEyearmon, transition_length = 1, state_length = 1) +
  ease_aes('linear')

我重新排序了 NAME,所以它的排名是 DIAG_RATE_65_PLUS

gganimate 产生什么:

我现在有两个问题:

1) gganimate 究竟是如何重新排序数据的?有一些整体的一般重新排序,但每个月都没有按照 DIAG_RATE_65_PLUS 从小到大完美排序的框架。理想情况下,我希望最后一个月 "Aug 2018" 能够完美订购。根据“2018 年 8 月”的订购 NAME,之前所有月份的 x-axis。

2) gganimate 中是否有一个选项,其中组 "shift" 到条形图中每个月的正确排名?

我的评论查询图:

https://i.stack.imgur.com/s2UPw.gif https://i.stack.imgur.com/Z1wfd.gif

@JonSpring

    df %>%
  ggplot(aes(ordering, group = NAME)) +
  geom_tile(aes(y = DIAG_RATE_65_PLUS/2, 
                height = DIAG_RATE_65_PLUS,
                width = 0.9), alpha = 0.9, fill = "gray60") +
  geom_hline(yintercept = (2/3)*25, linetype="dotdash") +
  # text in x-axis (requires clip = "off" in coord_cartesian)
  geom_text(aes(y = 0, label = NAME), hjust = 2) + ## trying different hjust values
  theme(plot.title = element_text(hjust = 1, size = 22),
        axis.ticks.y = element_blank(), ## axis.ticks.y shows the ticks on the flipped x-axis (the now metric), and hides the ticks from the geog layer
        axis.text.y = element_blank()) + ## axis.text.y shows the scale on the flipped x-axis (the now metric), and hides the placeholder "ordered" numbers from the geog layer
  coord_cartesian(clip = "off", expand = FALSE) +
  coord_flip() +
  labs(title='{closest_state}', x = "") +
  transition_states(ACH_DATEyearmon, 
                    transition_length = 2, state_length = 1) +
  ease_aes('cubic-in-out')

对于 hjust=2,标签未对齐并四处移动。

将上面的代码改成hjust=1

@eipi10

df %>% 
  ggplot(aes(y=NAME, x=DIAG_RATE_65_PLUS)) +
  geom_barh(stat = "identity", alpha = 0.66) +
  geom_hline(yintercept=(2/3)*25, linetype = "dotdash") + #geom_vline(xintercept=(2/3)*25) is incompatible, but geom_hline works, but it's not useful for the plot
  labs(title='{closest_state}') +
  theme(plot.title = element_text(hjust = 1, size = 22)) +
  transition_states(ACH_DATEyearmon, transition_length = 1, state_length = 50) +
  view_follow(fixed_x=TRUE) +
  ease_aes('linear')

柱形排序由 ggplot 完成,不受 gganimate 影响。条形图根据每个 ACH_DATEyearmonDIAG_RATE_65_PLUS 的总和进行排序。下面我将展示条形图的排序方式,然后提供用于创建动画情节的代码,并在每一帧中按所需的顺序从低到高进行排序。

要查看柱状图的排序方式,首先让我们创建一些假数据:

library(tidyverse)
library(gganimate)
theme_set(theme_classic())

# Fake data
dates = paste(rep(month.abb, each=10), 2017)

set.seed(2)
df = data.frame(NAME=c(replicate(12, sample(LETTERS[1:10]))),
                ACH_DATEyearmon=factor(dates, levels=unique(dates)),
                DIAG_RATE_65_PLUS=c(replicate(12, rnorm(10, 30, 5))))

现在让我们制作一个条形图。条形是每个 NAMEDIAG_RATE_65_PLUS 的总和。注意 x 轴 NAME 值的顺序:

df %>% 
  ggplot(aes(reorder(NAME, DIAG_RATE_65_PLUS), DIAG_RATE_65_PLUS)) +
  geom_bar(stat = "identity", alpha = 0.66) +
  labs(title='{closest_state}') +
  theme(plot.title = element_text(hjust = 1, size = 22)) 

您可以在下面看到,当我们明确地将 DIAG_RATE_65_PLUSNAME 相加并按总和排序时,顺序是相同的:

df %>% group_by(NAME) %>% 
  summarise(DIAG_RATE_65_PLUS = sum(DIAG_RATE_65_PLUS)) %>% 
  arrange(DIAG_RATE_65_PLUS)
   NAME DIAG_RATE_65_PLUS
1     A          336.1271
2     H          345.2369
3     B          346.7151
4     I          350.1480
5     E          356.4333
6     C          367.4768
7     D          368.2225
8     F          368.3765
9     J          368.9655
10    G          387.1523

现在我们要创建一个动画,对每个 ACH_DATEyearmonDIAG_RATE_65_PLUS 分别排序 NAME。为此,我们首先生成一个名为 order 的新列,用于设置我们想要的顺序:

df = df %>% 
  arrange(ACH_DATEyearmon, DIAG_RATE_65_PLUS) %>% 
  mutate(order = 1:n())

现在我们创建动画。 transition_states 为每个 ACH_DATEyearmon 生成帧。 view_follow(fixed_y=TRUE)仅显示当前 ACH_DATEyearmon 的 x 值,并为所有帧保持相同的 y 轴范围。

请注意,我们使用 order 作为 x 变量,但随后我们 运行 scale_x_continuous 将 x 标签更改为 NAME 值。我在图中包含了这些标签,因此您可以看到它们随每个 ACH_DATEyearmon 而变化,但您当然可以像在示例中那样在实际图中删除它们。

p = df %>% 
  ggplot(aes(order, DIAG_RATE_65_PLUS)) +
    geom_bar(stat = "identity", alpha = 0.66) +
    labs(title='{closest_state}') +
    theme(plot.title = element_text(hjust = 1, size = 22)) +
    scale_x_continuous(breaks=df$order, labels=df$NAME) +
    transition_states(ACH_DATEyearmon, transition_length = 1, state_length = 50) +
    view_follow(fixed_y=TRUE) +
    ease_aes('linear')

animate(p, nframes=60)

anim_save("test.gif")

如果您关闭 view_follow(),您可以看到 "whole" 剧情的样子(当然,您可以通过在transition_states行)。

p = df %>% 
  ggplot(aes(order, DIAG_RATE_65_PLUS)) +
    geom_bar(stat = "identity", alpha = 0.66) +
    labs(title='{closest_state}') +
    theme(plot.title = element_text(hjust = 1, size = 22)) +
    scale_x_continuous(breaks=df$order, labels=df$NAME) +
    transition_states(ACH_DATEyearmon, transition_length = 1, state_length = 50) +
    #view_follow(fixed_y=TRUE) +
    ease_aes('linear')

更新:回答您的问题...

要按给定月份的值排序,请将数据转换为具有按该月排序的水平的因子。要绘制旋转图,而不是 coord_flip,我们将使用 ggstance 包中的 geom_barh(水平条形图)。请注意,我们必须在 aesview_follow() 中切换 y 和 x,并且 y 轴 NAME 值的顺序现在是常量:

library(ggstance)

# Set NAME order based on August 2017 values
df = df %>% 
  arrange(DIAG_RATE_65_PLUS) %>% 
  mutate(NAME = factor(NAME, levels=unique(NAME[ACH_DATEyearmon=="Aug 2017"])))

p = df %>% 
  ggplot(aes(y=NAME, x=DIAG_RATE_65_PLUS)) +
  geom_barh(stat = "identity", alpha = 0.66) +
  labs(title='{closest_state}') +
  theme(plot.title = element_text(hjust = 1, size = 22)) +
  transition_states(ACH_DATEyearmon, transition_length = 1, state_length = 50) +
  view_follow(fixed_x=TRUE) +
  ease_aes('linear')

animate(p, nframes=60)
anim_save("test3.gif")

对于平滑过渡,@JonSpring 的回答似乎处理得很好。

为了补充@eipi10 的出色答案,我认为在这种情况下值得更换 geom_bar 以获得更大的灵活性。 geom_bar 通常对于离散类别非常方便,但它并不能让我们充分利用 gganimate 丝般流畅的动画效果。

例如,使用 geom_tile,我们可以重新创建与 geom_bar 相同的外观,但在 x 轴上有流畅的移动。这有助于保持对每个柱的视觉跟踪,并查看哪些柱的顺序变化最多。我认为这很好地解决了你问题的第二部分。

为了完成这项工作,我们可以向数据中添加一个新列,显示每个月应该使用的顺序。我们将此订单保存为双精度而不是整数(通过使用 * 1.0)。这将允许 gganimate 在位置 1 和 2 之间设置动画时在位置 1.25 放置一个条。

df2 <- df %>%
  group_by(ACH_DATEyearmon) %>%
  mutate(ordering = min_rank(DIAG_RATE_65_PLUS) * 1.0) %>%
  ungroup() 

现在我们可以用类似的方式绘图,但使用 geom_tile 而不是 geom_bar。我想在顶部和轴上显示 NAME,所以我使用了两个具有不同 y 值的 geom_text 调用,一个在零,一个在条的高度。 vjust 让我们使用文本行单位垂直对齐。

这里的另一个技巧是在 coord_cartesian 中关闭裁剪,这让底部文本位于绘图区域下方,进入 x 轴文本通常所在的位置。

p <- df2 %>%
  ggplot(aes(ordering, group = NAME)) +

  geom_tile(aes(y = DIAG_RATE_65_PLUS/2, 
                height = DIAG_RATE_65_PLUS,
                width = 0.9), alpha = 0.9, fill = "gray60") +
  # text on top of bars
  geom_text(aes(y = DIAG_RATE_65_PLUS, label = NAME), vjust = -0.5) +
  # text in x-axis (requires clip = "off" in coord_cartesian)
  geom_text(aes(y = 0, label = NAME), vjust = 2) +
  coord_cartesian(clip = "off", expand = FALSE) +

  labs(title='{closest_state}', x = "") +
  theme(plot.title = element_text(hjust = 1, size = 22),
        axis.ticks.x = element_blank(),
        axis.text.x  = element_blank()) + 

  transition_states(ACH_DATEyearmon, 
                    transition_length = 2, state_length = 1) +
  ease_aes('cubic-in-out')

animate(p, nframes = 300, fps = 20, width = 400, height = 300)

回到您的第一个问题,这是我通过从 geom_tile 调用中删除 fill = "gray60" 制作的彩色版本。我按照 2017 年 8 月的顺序对 NAME 类别进行了排序,因此它们看起来是按顺序排列的,正如您所描述的那样。

可能有更好的排序方法,但我是通过将 df2 加入 table 并仅使用 2017 年 8 月的排序来实现的。

Aug_order <- df %>%
  filter(ACH_DATEyearmon == "Aug 2017") %>%
  mutate(Aug_order = min_rank(DIAG_RATE_65_PLUS) * 1.0) %>%
  select(NAME, Aug_order)

df2 <- df %>%
  group_by(ACH_DATEyearmon) %>%
  mutate(ordering = min_rank(DIAG_RATE_65_PLUS) * 1.0) %>%
  ungroup() %>%
  left_join(Aug_order) %>%
  mutate(NAME = fct_reorder(NAME, -Aug_order))