对于不平衡的二元分类模型,我应该使用哪个指标?

Which metric I should use for unbalanced binary classification model?

我对不平衡的数据集执行了 SVM,将 train/test 分成 70/30。训练集中的实例数为1163993class个个和234190个实例class0。对于测试集,我有 498699 个实例 class 1100189 个实例 class0。 SVM的混淆矩阵显示如下:

我应该使用什么指标来评估模型?这可能是使用 f-avg 的解决方案,以这种方式计算每个 class 的精度、召回率和 f-1 分数:

然后通过计算每个 class 的两个 f-1 分数的算术平均值来计算 f-avg,如上一个 table?[= 的最后一行所报告的12=]

我假设您正在寻找概率评估指标。在我看来,使用 AUC-ROC(它是使用精度和召回率计算的)将是正确的方法,实际上对于大多数二元分类问题。

另请参阅this article