关于 Group_by 和 R[DPLYR Package] 中的 Summarize 函数的误解

Misconception regarding Group_by and Summarize function in R[DPLYR Package]

我必须绘制每年的死亡人数图表。所以我拿出了 从日期开始的年份,然后按它分组,然后我总结了这样我 获得每年的死亡人数。但是当我 运行 然后它给我整个数据集的死亡人数。

我不明白为什么?和任何其他替代每年获得死亡人数。

在数据集中,死亡人数是按事件给出的,每年都会发生很多事件。

crash_data=read.csv("https://raw.githubusercontent.com/gluque/analytics_task2/master/Airplane_Crashes_and_Fatalities_Since_1908.csv")
    > crash_data$Date <- as.Date(crash_data$Date, "%m/%d/%Y")
    > crash_data$Date <- format(crash_data$Date, '%Y')
    > cd<-subset(crash_data,select = c(Fatalities,Date))
    > ab<-group_by(cd,Date)
    > ef<-summarize(ab,Fatalities=sum(Fatalities,na.rm = TRUE))
    > ef
      Fatalities
    1     105479
> group_by(cd,Date) %>% summarize(Fatalities = sum(Fatalities, na.rm = TRUE))
#    # A tibble: 98 x 2
#       Date Fatalities
#      <chr>      <int>
#  1   1908          1
#  2   1912          5
#  3   1913         45
#  4   1915         40
#  5   1916        108
#  6   1917        124
#  7   1918         65
#  8   1919          5
#  9   1920         24
#  10  1921         68
# ... with 88 more rows