R中的百分位数类别
percentile categories in R
我有一个类似于以下的数据集,我想根据百分位数在 high/medium/low 中对我的值进行分类。我使用以下内容,但我对 99% 和高于此值的值感到困惑。
data(iris)
quantile(iris$Petal.Length, probs = 0.01)# all the values less than 1.149 are low
quantile(iris$Petal.Length, probs = 0.99)# here must be the high-values category
问题:
- 有些值大于 99% 的百分位数 (6.7)。这些值属于哪里?
- 什么是中等类别?
- 大于 99. 百分位数的值在您的前 1% 中。根据您的论点,这些将是高值,即 > 6.7
- 中等类别是指第 99 个百分位数中的所有内容,不包括第 1 个百分位数中的内容,即 1.149 < 中等 < 6.7
为了更清楚地说明这一点,这里有一张图表显示了人体身高的第 5 个和第 95 个百分位数。在您的示例中,它被分配到三个类别。
我有一个类似于以下的数据集,我想根据百分位数在 high/medium/low 中对我的值进行分类。我使用以下内容,但我对 99% 和高于此值的值感到困惑。
data(iris)
quantile(iris$Petal.Length, probs = 0.01)# all the values less than 1.149 are low
quantile(iris$Petal.Length, probs = 0.99)# here must be the high-values category
问题:
- 有些值大于 99% 的百分位数 (6.7)。这些值属于哪里?
- 什么是中等类别?
- 大于 99. 百分位数的值在您的前 1% 中。根据您的论点,这些将是高值,即 > 6.7
- 中等类别是指第 99 个百分位数中的所有内容,不包括第 1 个百分位数中的内容,即 1.149 < 中等 < 6.7
为了更清楚地说明这一点,这里有一张图表显示了人体身高的第 5 个和第 95 个百分位数。在您的示例中,它被分配到三个类别。