在 R 中排名时如何保留连续的 (1,2,3,...n) 排名符号?
How do I preserve continuous (1,2,3,...n) ranking notation when ranking in R?
如果我想使用共享案例的最低排名(又名并列)对一组数字进行排名:
dat <- c(13,13,14,15,15,15,15,15,15,16,17,22,45,46,112)
rank(dat, ties = 'min')
我得到结果:
1 1 3 4 4 4 4 4 4 10 11 12 13 14 15
但是,我希望排名是一个由 1,2,3,...n 组成的连续序列,其中 n 是唯一等级的数量。
有没有办法让rank
(或类似的函数)通过将平局分配给上面的最低排名来对一系列数字进行排名但是 而不是根据之前的关系数跳过后续排名值 而是从之前的排名继续排名?
例如,我希望上述排名结果为:
1 1 2 3 3 3 3 3 3 4 5 6 7 8 9
你可以使用 dplyr 做到这一点:
library(dplyr)
dense_rank(dat)
[1] 1 1 2 3 3 3 3 3 3 4 5 6 7 8 9
如果您不想加载整个库并在 base r 中执行:
match(dat, sort(unique(dat)))
[1] 1 1 2 3 3 3 3 3 3 4 5 6 7 8 9
使用 factor
然后将其恢复为 numeric
格式:
as.numeric(factor(rank(dat)))
# [1] 1 1 2 3 3 3 3 3 3 4 5 6 7 8 9
如果我想使用共享案例的最低排名(又名并列)对一组数字进行排名:
dat <- c(13,13,14,15,15,15,15,15,15,16,17,22,45,46,112)
rank(dat, ties = 'min')
我得到结果:
1 1 3 4 4 4 4 4 4 10 11 12 13 14 15
但是,我希望排名是一个由 1,2,3,...n 组成的连续序列,其中 n 是唯一等级的数量。
有没有办法让rank
(或类似的函数)通过将平局分配给上面的最低排名来对一系列数字进行排名但是 而不是根据之前的关系数跳过后续排名值 而是从之前的排名继续排名?
例如,我希望上述排名结果为:
1 1 2 3 3 3 3 3 3 4 5 6 7 8 9
你可以使用 dplyr 做到这一点:
library(dplyr)
dense_rank(dat)
[1] 1 1 2 3 3 3 3 3 3 4 5 6 7 8 9
如果您不想加载整个库并在 base r 中执行:
match(dat, sort(unique(dat)))
[1] 1 1 2 3 3 3 3 3 3 4 5 6 7 8 9
使用 factor
然后将其恢复为 numeric
格式:
as.numeric(factor(rank(dat)))
# [1] 1 1 2 3 3 3 3 3 3 4 5 6 7 8 9