如何确定 R 中特定因素分类标签的数值范围

How to determine a numeric range for a specific factor classification label in R

我的标签有问题。我是 运行 层次聚类分析,我需要标记我的数据范围。这是我的代码的一部分,针对特定变量,我尝试在其中标记一些级别:

comisiones[["Monto.Pago.Credito"]] <- ordered(cut(comisiones[["Monto.Pago.Credito"]], c(100.96, 382.30, 866.80, 1040, 11500 )), labels = c("min", "1er Quartil", "3er Quartil", "Max"))

我从“DATA MINING AND”一书的一个例子中得到了这个结构 使用 R 进行业务分析”(Johannes Ledolter,2013 年)。

这段代码截断了我的一些数据,将它们变成 NULL 值,这就是我的问题。

我相信您可以通过在第二个 cut 参数中添加略微 above/below 您的最小值和最大值的下限值和上限值来解决您的问题。

这是一个可重现的例子:

cut(1:10, c(3,7,8))
[1] <NA>  <NA>  <NA>  (3,7] (3,7] (3,7] (3,7] (7,8] <NA>  <NA>
Levels: (3,7] (7,8]

添加上下限值:

> cut(1:10, c(0,3,7,8,11))
[1] (0,3]  (0,3]  (0,3]  (3,7]  (3,7]  (3,7]  (3,7]  (7,8]  (8,11] (8,11]
Levels: (0,3] (3,7] (7,8] (8,11]

cut(...)中,使用参数include.lowest = TRUE,即

ordered(cut(comisiones[["Monto.Pago.Credito"]], c(100.96, 382.30, 866.80, 1040, 11500 ), include.lowest = TRUE), labels = c("min","1er Quartil", "3er Quartil", "Max"))