如何计算 R 中子样本的 AUC
How to calculate AUCs for subsamples in R
我设法计算了我的数据集的总体 AUC,但现在我有兴趣计算和比较我的数据集子样本的 AUC。关于如何在 R 中解决这个问题有什么想法吗?
您好,
IG
如果没有一些数据样本,很难帮助您解决问题,但让我们假设您有一个包含某些 ID、一些预测和一些结果的数据框。
然后您可以使用dplyr 对数据进行分组并对数据的子集执行计算。我使用包 pROC 来计算组的 auc。
d <- tibble::tibble(
id = c(1,1,1,1,1,2,2,2,2,2),
predicitons = runif(10),
outcome = factor(c("yes", "no", "yes", "no", "no", "no", "yes", "no", "yes", "yes")))
d %>%
dplyr::group_by(id) %>%
dplyr::summarise(
auc = as.numeric(pROC::auc(predictor = predicitons, response = outcome)))
祝你好运!
非常感谢@Jagge!
我确实采用了子采样的方式,然后为每个小数据集使用 pROC 计算 AUC。出于某种原因,我想到我可以在分析中进行拆分——但这超出了我的能力:)
我设法计算了我的数据集的总体 AUC,但现在我有兴趣计算和比较我的数据集子样本的 AUC。关于如何在 R 中解决这个问题有什么想法吗?
您好, IG
如果没有一些数据样本,很难帮助您解决问题,但让我们假设您有一个包含某些 ID、一些预测和一些结果的数据框。
然后您可以使用dplyr 对数据进行分组并对数据的子集执行计算。我使用包 pROC 来计算组的 auc。
d <- tibble::tibble(
id = c(1,1,1,1,1,2,2,2,2,2),
predicitons = runif(10),
outcome = factor(c("yes", "no", "yes", "no", "no", "no", "yes", "no", "yes", "yes")))
d %>%
dplyr::group_by(id) %>%
dplyr::summarise(
auc = as.numeric(pROC::auc(predictor = predicitons, response = outcome)))
祝你好运!
非常感谢@Jagge! 我确实采用了子采样的方式,然后为每个小数据集使用 pROC 计算 AUC。出于某种原因,我想到我可以在分析中进行拆分——但这超出了我的能力:)