在 ggplot 中使用 facet_wrap 的时间序列的 X 轴重复项

X-axis duplicates for a time series using facet_wrap in ggplot

希望您今天过得愉快!所以,我有一个大约二十年的大型数据集,我试图使用 facet_wrap 参数来可视化它。以下是用于故障排除目的的简化数据版本:

data <- data.frame(
Date = c("1993-06-09", "1993-08-16", "1993-09-13", "1993-10-11", "1993-11-08", "1994-03-06", "1994-05-20", "1994-07-12", "1994-12-06", "1994-09-07", "1995-04-04", "1995-01-07", "1995-02-06"),
Oxygen = c("15", "15.8", "15.3", "16", "16", "14.5", "14.9", "15.2", "15.7", "15", "12.6", "12.8", "13.5"),
Year = c("1993", "1993", "1993", "1993", "1993", "1994", "1994", "1994", "1994", "1994", "1995", "1995", "1995"),
Month = c("6", "8", "9", "10", "11", "3", "5", "7", "12", "9", "4", "1", "2"),
Day = c("9", "16", "13", "11", "8", "6", "20", "12", "6", "7", "4", "7", "6")
)

这是它周围的其余代码:

data$Oxygen <- as.numeric(as.character(data$Oxygen))
data$Year <- as.numeric(as.character(data$Year))
data$Month <- as.numeric(as.character(data$Month))
data$Day <- as.numeric(as.character(data$Day))
data$Date <- as.Date(data$Date)
ggplot(data = data, aes(x=Date, y=Oxygen)) + geom_point() + geom_smooth(method = "loess", se=FALSE) + facet_wrap( ~ Year, ncol=2) + scale_x_date(date_breaks = "1 month", date_labels = "%B")  + theme(axis.text.x=element_text(angle = 90, hjust = 1)) +  theme(panel.grid.major = element_blank(), panel.grid.minor = element_blank(),panel.background = element_blank(), axis.line = element_line(colour = "black"))

代码创建此图:

我的问题出在 x 轴上。我如何更改它,以便它不会为每一年创建一个连续的月份系列?我想要它,以便它全部适合一年的月份,而不是创造更多的月份,就好像每年都不一样。

这是我把剩下的岁月放进去后的样子:

它绘制的是每年的 x 轴,而不仅仅是一年中的月份。

最后,我如何告诉 ggplot 我想查看每个月的星期或日期,以便并非所有点都集中在该月沿 x 轴的固定点上。

感谢您的宝贵时间!

选项 1:(根据评论重述)- 使用 facet_wrap 仅显示相关的 window 时间。

ggplot(data = data, aes(x=Month, y=Oxygen)) + 
  geom_point() + 
  geom_smooth(method = "loess", se=FALSE) + 
  facet_wrap( ~ Year, ncol=2, scales = 'free_x') + 
  scale_x_date(date_breaks = "1 month", date_labels = "%B")  + 
  theme(
    axis.text.x=element_text(angle = 90, hjust = 1),
    panel.grid.major = element_blank(), 
    panel.grid.minor = element_blank(),
    panel.background = element_blank(),
    axis.line = element_line(colour = "black")
  )

选项2:使用Month作为x轴:

ggplot(data = data, aes(x=Month, y=Oxygen)) + 
  geom_point() + 
  geom_smooth(method = "loess", se=FALSE) + 
  facet_wrap( ~ Year, ncol=2) + 
  scale_x_continuous(name = "Date", breaks = 1:12, labels = month.name) + 
  # scale_x_date(date_breaks = "1 month", date_labels = "%B")  + 
  theme(
    axis.text.x=element_text(angle = 90, hjust = 1),
    panel.grid.major = element_blank(), 
    panel.grid.minor = element_blank(),
    panel.background = element_blank(),
    axis.line = element_line(colour = "black")
  )

我不怎么处理日期,所以这是一个 hack - 但它可能足够好 until/unless 有人展示了一个很好的解决方案。

ggplot(data = data, aes(x=Month + pmin(Day/30, 1), y=Oxygen)) + 
  geom_point() + 
  geom_smooth(method = "loess", se=FALSE) + 
  facet_wrap( ~ Year, ncol=2) + 
  scale_x_continuous(name = "Date", breaks = 1:12, labels = month.name) + 
  # scale_x_date(date_breaks = "1 month", date_labels = "%B")  + 
  theme(
    axis.text.x=element_text(angle = 90, hjust = 1),
    panel.grid.major = element_blank(), 
    panel.grid.minor = element_blank(),
    panel.background = element_blank(),
    axis.line = element_line(colour = "black")
  )

要获得一致的月份休息时间,您可以创建一个日期虚拟变量,所有日期都使用同一年,并按实际年份分类。这样,您仍然在 x 轴上有一个日期,使您可以访问 scale_x_date,但可以按年份整齐地拆分数据。

为了简洁和偏好,我使用 dplyr 进行了清理,并创建了一个虚拟日期列,我将年份更改为 2018 年,然后使用 lubridate::ymd 转换为日期对象。

library(tidyverse)
library(lubridate)

data2 <- data %>%
  mutate_at(vars(-Date), function(x) as.numeric(as.character(x))) %>%
  mutate(Date = as.Date(Date)) %>%
  mutate(dummy_date = paste("2018", Month, Day) %>% ymd())


ggplot(data2, aes(x = dummy_date, y = Oxygen, group = Year)) +
  geom_point() +
  geom_smooth(method = loess, se = FALSE) +
  scale_x_date(date_breaks = "1 month", date_labels = "%B") +
  theme(axis.text.x = element_text(angle = 90, hjust = 1)) +
  facet_wrap(~ Year, ncol = 2)

reprex package (v0.2.0) 创建于 2018-06-25。