ROCR - 奇怪的 ROC 曲线

ROCR - weird ROC curve

我有一些用于评分的 p 值。每个概率给出真阳性或假阳性。这个想法是绘制统计测试的性能。但是,我生成的 ROC 曲线毫无意义。请复制并粘贴代码以重现它。

代码:

library(ROCR)
scores <- c(1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,0.999999999999998,0.999999999999982,0.999999999999943,0.999999999999782,0.999993691351422,0.999930748187179,0.999929270075887,0.995652667490613,0.993101105927916,0.983764828478107,0.962452067884637,0.908463667964783)
labels <- c(2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,1,2,2,2,2,2,2,2,2,2,1,1,2,2,2,2,2,2,2,2,2,1,2,2,1,2,2,2,2)
orders <- c(1, 2)

pred <- prediction(scores, labels, label.ordering=orders)
perf <- performance(pred, "tpr","fpr")

plot(perf, colorize=TRUE, cex.lab=2, cex.main=2, lwd=10)

关于中华民国: ROC 曲线显示了 FPR 和 TPR 之间对所有可能阈值的权衡,因此可以查看曲线并选择最佳阈值。这完全取决于您要解决的业务案例。你想最小化 FPR 或 TPR 还是其他?

关于问题: 在这种情况下,对角线意味着 FPR 和 TPR 之间没有权衡(直到某个点)。将观察结果贴错标签的可能性是相同的,无论它是积极的还是消极的,这在 IMO 是完全有可能的。但这是否违背直觉?这取决于您要解决的业务案例。