提取唯一列组合并在 R 中查找总和和计数

Question

我有一个包含 4 列的航班数据库，如下所示。

原文：

我想要一个输出，它根据 3 列 (origin/destination/Airline) 的唯一组合给出行，对每个唯一组合的乘客人数求和，并计算每个唯一组合的行数。结果会是这样的。

输出：

我可以使用 group_by 函数完成其中的一部分

df %>% group_by(Origin, destination, carrier) %>% summarise(count = n())

如何包含人口总和？

Answer 1

我们可以使用dplyr

library(dplyr)
df1 %>%
   group_by(Origin, Destination, Airline) %>%
   dplyr::summarise(count = n(), TotalPassengers = sum(Passengers))
# Groups:   Origin, Destination [2]
#  Origin Destination Airline count TotalPassengers
#  <chr>  <chr>       <chr>   <int>           <dbl>
#1 ABE    ATL         9A          2               3
#2 ABE    ATL         DL          1               5
#3 NYC    SFA         AA          3              21
#4 NYC    SFA         DL          1               5

数据

df1 <- data.frame(Origin = rep(c("ABE", "NYC"), c(3, 4)),
      Destination = rep(c("ATL", "SFA"), c(3, 4)),
      Airline = c("9A", "9A", "DL", "AA", "AA", "AA", "DL"),
      Passengers = c(2, 1, 5, 4, 10, 7, 5))

提取唯一列组合并在 R 中查找总和和计数

Extracting unique column combination and finding sum and count in R

group-by

r

summarize

数据