不同组大小的精度和召回计算

Precision and Recall computation for different group sizes

我没有在任何地方找到这个问题的答案,所以我希望这里有人可以帮助我和其他有同样问题的人。

假设我有1000个正样本1500个负样本.

现在,假设有 950 个 True Positives(正样本被正确分类为正样本)和 100 False Positives(负样本被错误分类为正样本)。

我应该使用这些原始数字来计算 精度,还是应该考虑不同的组大小?

换句话说,我的精度应该是:

TruePositive / (TruePositive + FalsePositive) = 950 / (950 + 100) = 90.476%

应该是:

(TruePositive / 1000) / [(TruePositive / 1000) + (FalsePositive / 1500)] = 0.95 / (0.95 + 0.067) = 93.44%

在第一次计算中,我采用了原始数据,没有考虑每组中的样本数量,而在第二次计算中,我使用了每个度量在其对应组中的比例,以消除造成的偏差按小组大小

回答所述问题:根据definition,精度由第一个公式计算:TP/(TP+FP)。

但是,这并不意味着你必须使用这个公式,即精度测量。还有许多其他措施,请查看 this wiki page 上的 table,然后选择最适合您任务的一项。

例如,positive likelihood ratio 似乎与您的第二个公式最相似。