理解函数分位数的问题

problems to understand the function quantile

我的观测值数量不均匀,我想将它们组合成四分位数。为此,我使用了分位数函数:

a <- round(rnorm(187, mean=100, sd=20))
Quartile <- as.integer(cut(a, quantile(a, probs=0:4/4), include.lowest=TRUE))

不出所料,每个四分位数的观测值数量不同。我的问题是,是什么决定了一个介于(例如)四分位数 1 和四分位数 2 之间的观察值最终分配给四分位数 1。

如有任何帮助,我们将不胜感激

这个问题实际上是关于 cut 如何运作的。请参阅下面的参数。

cut(x, breaks, labels = NULL,
    include.lowest = FALSE, right = TRUE, dig.lab = 3,
    ordered_result = FALSE, …)

您的问题涉及名为“right”的参数,该参数决定区间是否包含区间右侧或左侧的值。您可以根据要使用的包含规则类型更改此参数。选择哪种方式在统计上没有硬性规定;这取决于您,但是一旦您为任何给定项目做出决定,就应该始终如一地使用相同的方法。

不过我想回答你的问题,如果你坚持使用默认值并且有东西落在边界上,它将被包含在较低的间隔中。