分类数据的四分位数范围

Interquartile range for categorical data

有人要求我根据 IQR 和分类变量的中位数报告结果的描述性统计数据,但我不知道该怎么做!我知道逻辑,但在连续数据中。

谁能解释一下如何计算分类变量?以及如何在 R 中做到这一点?

我假设您想计算按分类变量分组的变量的中位数和 IQR。在基础 R 中,您可以为此使用聚合。您还可以查找 tidyverse,它具有方便的 group_bysummarize 函数。

df <- data.frame(
  c("m", "f", "m", "x"),
  c(20, 21, 64, 42),
  c(191, 180, 176, 177)
)
names(df) <- c("gender", "age", "length")
aggregate(length ~ gender, df, IQR)
aggregate(length ~ gender, df, median)

这有输出

aggregate(length ~ gender, df, IQR)
  gender length
1      f    0.0
2      m    7.5
3      x    0.0

aggregate(length ~ gender, df, median)
  gender length
  gender length
1      f  180.0
2      m  183.5
3      x  177.0