多类分类问题的精度与召回率
Precision Versus Recall for Multiclass classification problem
假设我有三个 class 表示我的模型需要 class 化的子宫颈类型。总体目标是预测正确的子宫颈class,以便医疗保健提供者可以为患者提供最合适的宫颈癌治疗。错误class 化子宫颈类型将花费医疗提供者的诊断时间和患者的治疗费用。在这种情况下,准确率比召回率更重要吗?
谨记:
回忆一下: 是真阳性和假阴性的比值。因此,它衡量预测良好的 class 与此 class 的所有样本之间的比率。如果您的目标是识别 class 的所有样本(例如,预测所有患有癌症的人),这很好。
精度: 真阳性与假阳性的比值。因此,它测量预测良好的 class 与预测为 class 的所有样本之间的比率。如果您的目标是避免误报(例如,避免在实际未怀孕时预测女性怀孕),这很好。
在这种情况下,我认为更多地了解错误的后果很重要。如果一个人是 A 型但她被预测为 B 型,是否会有生命危险?有没有哪种类型是最安全的(即使人被误class也没有生命危险)?最危险(有生命危险)?
根据答案,您将能够选择最佳指标。
假设有最安全和最危险的类型,危险类型中的召回会更相关,因为您必须识别所有类型(尽可能多)。
假设我有三个 class 表示我的模型需要 class 化的子宫颈类型。总体目标是预测正确的子宫颈class,以便医疗保健提供者可以为患者提供最合适的宫颈癌治疗。错误class 化子宫颈类型将花费医疗提供者的诊断时间和患者的治疗费用。在这种情况下,准确率比召回率更重要吗?
谨记:
回忆一下: 是真阳性和假阴性的比值。因此,它衡量预测良好的 class 与此 class 的所有样本之间的比率。如果您的目标是识别 class 的所有样本(例如,预测所有患有癌症的人),这很好。
精度: 真阳性与假阳性的比值。因此,它测量预测良好的 class 与预测为 class 的所有样本之间的比率。如果您的目标是避免误报(例如,避免在实际未怀孕时预测女性怀孕),这很好。
在这种情况下,我认为更多地了解错误的后果很重要。如果一个人是 A 型但她被预测为 B 型,是否会有生命危险?有没有哪种类型是最安全的(即使人被误class也没有生命危险)?最危险(有生命危险)?
根据答案,您将能够选择最佳指标。
假设有最安全和最危险的类型,危险类型中的召回会更相关,因为您必须识别所有类型(尽可能多)。