分类数据的四分位数范围
Interquartile range for categorical data
有人要求我根据 IQR 和分类变量的中位数报告结果的描述性统计数据,但我不知道该怎么做!我知道逻辑,但在连续数据中。
谁能解释一下如何计算分类变量?以及如何在 R 中做到这一点?
我假设您想计算按分类变量分组的变量的中位数和 IQR。在基础 R 中,您可以为此使用聚合。您还可以查找 tidyverse,它具有方便的 group_by
和 summarize
函数。
df <- data.frame(
c("m", "f", "m", "x"),
c(20, 21, 64, 42),
c(191, 180, 176, 177)
)
names(df) <- c("gender", "age", "length")
aggregate(length ~ gender, df, IQR)
aggregate(length ~ gender, df, median)
这有输出
aggregate(length ~ gender, df, IQR)
gender length
1 f 0.0
2 m 7.5
3 x 0.0
aggregate(length ~ gender, df, median)
gender length
gender length
1 f 180.0
2 m 183.5
3 x 177.0
有人要求我根据 IQR 和分类变量的中位数报告结果的描述性统计数据,但我不知道该怎么做!我知道逻辑,但在连续数据中。
谁能解释一下如何计算分类变量?以及如何在 R 中做到这一点?
我假设您想计算按分类变量分组的变量的中位数和 IQR。在基础 R 中,您可以为此使用聚合。您还可以查找 tidyverse,它具有方便的 group_by
和 summarize
函数。
df <- data.frame(
c("m", "f", "m", "x"),
c(20, 21, 64, 42),
c(191, 180, 176, 177)
)
names(df) <- c("gender", "age", "length")
aggregate(length ~ gender, df, IQR)
aggregate(length ~ gender, df, median)
这有输出
aggregate(length ~ gender, df, IQR)
gender length
1 f 0.0
2 m 7.5
3 x 0.0
aggregate(length ~ gender, df, median)
gender length
gender length
1 f 180.0
2 m 183.5
3 x 177.0