良好的 ROC 曲线但较差的精确召回曲线

Good ROC curve but poor precision-recall curve

我有一些我不太明白的机器学习结果。我正在使用 python sciki-learn,具有大约 14 个特征的 2+ 百万数据。 'ab' 的分类在精确召回曲线上看起来很糟糕,但 Ab 的 ROC 看起来与大多数其他组的分类一样好。有什么可以解释的?

Class失衡。

与ROC曲线不同,PR曲线对不平衡非常敏感。如果您针对不平衡数据优化分类器以获得良好的 AUC,您可能会获得较差的精确召回结果。