classification_report 不平衡 class 的支持值指示

indication of Support value of classification_report for imbalanced class

我有一个不平衡的数据集,我正在尝试进行二进制 class化。我最终使用了几种算法 CatBoostClassifierlightgbm 给了我比较好的结果。我有一个关于 classification_reportconfusion_matrix.

的问题要问

从我的 classification_report 可以看出: -True Negatives: 1076, -False Positives: 0, -False Negatives: 1, -True Positives: 6.

Sensitivity : 0.86 和 Specificity 1.00 ,这意味着我的 false positive rate 是 0.0.

我觉得它确实表现得很好。

classification_report 它是否告诉您我的模型可能过度拟合或者它确实表现良好?

我问这个是因为 class 1support (数量较少)是 7 而 class 0 是1076.

来自 link 它说:“支持是 class 中真实响应的样本数。” 但我不太明白这里的意思。

任何人都可以向我解释或让我知道我的算法是否过拟合或表现良好?

标签比例:

0    5550
1      60

分类报告

              precision    recall  f1-score   support

         0.0       1.00      1.00      1.00      1076
         1.0       1.00      0.86      0.92         7

    accuracy                           1.00      1083
   macro avg       1.00      0.93      0.96      1083
weighted avg       1.00      1.00      1.00      1083

混淆矩阵:

[[1076    0]
 [   1    6]]

class训练集和测试集的化验报告一起看会更好理解,只是看哪一个都不能确定在训练集或单独训练集上的表现。但是,如果我们假设您在此处显示的性能指标是针对测试集的,并且训练集中的性能也或多或少与您在测试集中观察到的相似,那么我会说该模型做得很好工作。 class 1 的召回率是 86%,因为它只构成数据集的 1% 非常好。

此外,支持度是指数据集中属于特定 class 的示例总数,例如,在您的情况下,class 0 的支持度是 5550 而 class 160