解释混淆矩阵
interpreting the confusion matrix
我需要创建一个 class化模型来预测特定事件的 class - 1、2 或 3。到目前为止我尝试了两个模型:multiclass 决策树& multiclass 神经网络。以下是它们每个的准确度得分和混淆矩阵。
多class决策树:
整体精度 0.634
平均准确度 0.756
微平均精度 0.634
宏平均精度 0.585184
微平均召回率 0.634
宏观平均召回率 0.548334
混淆矩阵:
- 40.3% 53.6% 6.1%
- 6.6% 76.6% 16.8%
- 0.6% 51.8% 47.6%
multiclass 神经网络:
整体精度 0.5865
平均精度 0.724333
微平均精度 0.5865
宏平均精度 0.583795
微平均召回率 0.5865
宏观平均召回率 0.460215
混淆矩阵:
34.8% 63.5% 1.7%
2.9% 89.3% 7.7%
0.1% 85.9% 13.9%
我认为这意味着在 Class2 上,两个模型都做得很好,尤其是神经网络模型。在其他 classes 上,决策树模型做得更好,但仍低于 50%。
我应该如何根据这些指标改进结果?谢谢。
删除 id 特征,同时检查并删除您认为对预测没有任何价值的任何特征(任何其他特征,如 id)或具有唯一值的特征。还要检查是否存在任何 class 不平衡(数据中每个 class 有多少个样本,class 之间是否存在适当的平衡?)。然后尝试应用模型并调整参数以获得更好的结果。您可以使用 cross-validation 以获得更好的结果。
我需要创建一个 class化模型来预测特定事件的 class - 1、2 或 3。到目前为止我尝试了两个模型:multiclass 决策树& multiclass 神经网络。以下是它们每个的准确度得分和混淆矩阵。
多class决策树:
整体精度 0.634 平均准确度 0.756 微平均精度 0.634 宏平均精度 0.585184 微平均召回率 0.634 宏观平均召回率 0.548334
混淆矩阵:
- 40.3% 53.6% 6.1%
- 6.6% 76.6% 16.8%
- 0.6% 51.8% 47.6%
multiclass 神经网络: 整体精度 0.5865 平均精度 0.724333 微平均精度 0.5865 宏平均精度 0.583795 微平均召回率 0.5865 宏观平均召回率 0.460215
混淆矩阵:
34.8% 63.5% 1.7%
2.9% 89.3% 7.7%
0.1% 85.9% 13.9%
我认为这意味着在 Class2 上,两个模型都做得很好,尤其是神经网络模型。在其他 classes 上,决策树模型做得更好,但仍低于 50%。
我应该如何根据这些指标改进结果?谢谢。
删除 id 特征,同时检查并删除您认为对预测没有任何价值的任何特征(任何其他特征,如 id)或具有唯一值的特征。还要检查是否存在任何 class 不平衡(数据中每个 class 有多少个样本,class 之间是否存在适当的平衡?)。然后尝试应用模型并调整参数以获得更好的结果。您可以使用 cross-validation 以获得更好的结果。