计算分类精度的最佳方法?
The best way to calculate classification accuracy?
我知道一个计算class化验准确度的公式是X = t / n * 100(其中t是正确class化验的数量n 是样本总数。)
但是,假设我们总共有 100 个样本,class A 中有 80 个,class B 中有 10 个,class C 中有 10 个。
场景1:所有100个样本都分配给class A,通过使用公式,我们得到准确率等于80%。
场景 2: 10 个属于 B 的样本被正确分配给 class B ;10 个属于 C 的样本被正确分配给 class C 作为出色地; 30个属于A的样本正确分配给了classA;其余 50 个属于 A 的样本被错误地分配给了 C。通过使用该公式,我们得到了 50% 的准确率。
我的问题是:
1:我们能说场景一的准确率比场景二高吗?
2:class化问题有没有办法计算准确率?
非常感谢!
分类准确度定义为"percentage of correct predictions"。无论 classes 的数量如何,情况都是如此。因此,场景 1 比场景 2 具有更高的class化准确率。
但是,听起来您真正想要的是替代评估指标或流程,"rewards" 场景 2 仅用于犯某些类型的错误。我有两个建议:
- 创建 confusion matrix:它描述了 classifier 的性能,以便您可以查看 classifier 所犯的错误类型。
- 计算每个 class 的精度、召回率和 F1 分数。平均 F1 分数可能是您正在寻找的单数指标。
scikit-learn 文档的 Classification metrics section 有很多关于 classifier 评估的有用信息,即使您不是 scikit-learn 用户也是如此。
我知道一个计算class化验准确度的公式是X = t / n * 100(其中t是正确class化验的数量n 是样本总数。)
但是,假设我们总共有 100 个样本,class A 中有 80 个,class B 中有 10 个,class C 中有 10 个。
场景1:所有100个样本都分配给class A,通过使用公式,我们得到准确率等于80%。
场景 2: 10 个属于 B 的样本被正确分配给 class B ;10 个属于 C 的样本被正确分配给 class C 作为出色地; 30个属于A的样本正确分配给了classA;其余 50 个属于 A 的样本被错误地分配给了 C。通过使用该公式,我们得到了 50% 的准确率。
我的问题是:
1:我们能说场景一的准确率比场景二高吗?
2:class化问题有没有办法计算准确率?
非常感谢!
分类准确度定义为"percentage of correct predictions"。无论 classes 的数量如何,情况都是如此。因此,场景 1 比场景 2 具有更高的class化准确率。
但是,听起来您真正想要的是替代评估指标或流程,"rewards" 场景 2 仅用于犯某些类型的错误。我有两个建议:
- 创建 confusion matrix:它描述了 classifier 的性能,以便您可以查看 classifier 所犯的错误类型。
- 计算每个 class 的精度、召回率和 F1 分数。平均 F1 分数可能是您正在寻找的单数指标。
scikit-learn 文档的 Classification metrics section 有很多关于 classifier 评估的有用信息,即使您不是 scikit-learn 用户也是如此。