我如何对分类变量求和并按因子汇总
HOW can i sum a categorical variable and aggregate by factor
所以让我说得更具体一点.....
我有一个数据集
足球队 - 球员
巴萨 - 梅西
- 巴萨 - 梅西
- 巴萨 - 梅西
巴萨-哈维
-RM - CR
-RM - CR
-RM-PEPE
-RM -HIQUAIN
等等(只是一个例子,不是数据集)
列!!!
我想要这个问题的答案:
" 如何根据他们使用的球员数量找到前 5 名球队"
*球队可以多次使用球员,所以不可能找到因素水平
*因此,如果巴萨使用了 15 名球员,而 Rm 使用了 14 名球员,那么 BARCA 是第一个.....
library(dplyr)
df %>%
group_by(SOCCERTEAM) %>%
summarize(rank = n_distinct(PLAYERS)) %>%
top_n(5, wt = rank)
所以让我说得更具体一点..... 我有一个数据集
足球队 - 球员
巴萨 - 梅西
- 巴萨 - 梅西
- 巴萨 - 梅西
巴萨-哈维
-RM - CR
-RM - CR
-RM-PEPE
-RM -HIQUAIN 等等(只是一个例子,不是数据集)
列!!!
我想要这个问题的答案: " 如何根据他们使用的球员数量找到前 5 名球队" *球队可以多次使用球员,所以不可能找到因素水平 *因此,如果巴萨使用了 15 名球员,而 Rm 使用了 14 名球员,那么 BARCA 是第一个.....
library(dplyr)
df %>%
group_by(SOCCERTEAM) %>%
summarize(rank = n_distinct(PLAYERS)) %>%
top_n(5, wt = rank)