如何在 class 不平衡数据集 (gbm) 的 gbm 包和 Kappa 统计数据中定义权重
How to define weights in gbm package & Kappa statistic for class imbalanced data set (gbm)
我想找到一种方法来为 caret 包中的 gbm 定义权重。在 "caret" 包的 "train" 函数中有一个参数 "weights",但描述为 "This argument will only affect models that allow case weights"。根据我的理解 "gbm" 确实支持定义权重,但我不知道定义权重的格式。它只是 c(1,10) - 其中 1 代表多数 class,10 代表少数 class?
第二个问题是关于Kappa统计的。我读到 Kappa 是 class 不平衡数据集的更好性能指标,但未能理解如何实现。对于 class 不平衡数据集,为什么 Kappa 是比 ROC 更好的性能指标,我将不胜感激。
谢谢。
我想找到一种方法来为 caret 包中的 gbm 定义权重。在 "caret" 包的 "train" 函数中有一个参数 "weights",但描述为 "This argument will only affect models that allow case weights"。根据我的理解 "gbm" 确实支持定义权重,但我不知道定义权重的格式。它只是 c(1,10) - 其中 1 代表多数 class,10 代表少数 class?
第二个问题是关于Kappa统计的。我读到 Kappa 是 class 不平衡数据集的更好性能指标,但未能理解如何实现。对于 class 不平衡数据集,为什么 Kappa 是比 ROC 更好的性能指标,我将不胜感激。
谢谢。