如何计算 R 中子样本的 AUC

How to calculate AUCs for subsamples in R

我设法计算了我的数据集的总体 AUC,但现在我有兴趣计算和比较我的数据集子样本的 AUC。关于如何在 R 中解决这个问题有什么想法吗?

您好, IG

如果没有一些数据样本,很难帮助您解决问题,但让我们假设您有一个包含某些 ID、一些预测和一些结果的数据框。

然后您可以使用dplyr 对数据进行分组并对数据的子集执行计算。我使用包 pROC 来计算组的 auc。

d <- tibble::tibble(
  id = c(1,1,1,1,1,2,2,2,2,2),
  predicitons = runif(10),
  outcome = factor(c("yes", "no", "yes", "no", "no", "no", "yes", "no", "yes", "yes")))

d %>% 
  dplyr::group_by(id) %>% 
  dplyr::summarise(
    auc = as.numeric(pROC::auc(predictor = predicitons, response = outcome)))

祝你好运!

非常感谢@Jagge! 我确实采用了子采样的方式,然后为每个小数据集使用 pROC 计算 AUC。出于某种原因,我想到我可以在分析中进行拆分——但这超出了我的能力:)