为什么假阳性率和真阳性率在 roc-auc 曲线中加起来不为一?

Why don't the false positive rate and true positive rate add up to one in a roc-auc curve?

误报率是从 0 到 1 的 x 轴。真正率是从 0 到 1 的 y 轴。图表显示数据点,如 (.8,.8)。如果 tpr 是 .8 而 fpr 是 .8,它们加起来就是 1.6...

通常使用 test/validation 集中的 FP 或 TP 总数对轴进行归一化。否则曲线的末端不会是 1/1。我个人更喜欢用实例数来标记轴。

为什么不按总数归一化 - 在实际应用中,它变得相当复杂,因为您通常没有所有示例的标签。 ROC 曲线的典型示例是群发邮件。要正确标准化曲线,您需要向整个世界发送垃圾邮件。