IR 中的精确率和召回率

Precision And Recall in IR

一组包含 30 个位置提及的新闻文章。一个提取器提取了 24 个位置实体,其中 6 个是不正确的。 Precision 和 Recall 值是多少?

如果我错了请纠正我 TP=18,FP=6,FN=6,那么召回率和准确率都是 .75

遵循 Wikipedia 定义:

精度= |检索到相关文档| / |检索到的文件| = 18 / 24 = 0.75

召回 = |检索到相关文件| / |相关文件| = 18 / ??

为了计算出召回率,我们需要知道在 30 个位置的初始集合中有多少个正确的位置。

编辑:

考虑到新的问题陈述如下: “考虑一组包含 30 个位置提及的新闻文章。从这个来源中,提取器提取 24 个位置实体,其中 6 个是不正确的。Precision 和 Recall 值是多少?可能的答案:

  1. P = 0.80, R = 0.50
  2. P = 0.75,R = 0.60
  3. P = 0.60, R = 0.80
  4. P = 0.75,R = 0.50

没有可能的答案,四个选项中 none 个是可能的。

理由如下:精度可以很容易地计算出来,因为它已经完成了,值为 0.75

对于召回,我们不知道初始集合中正确位置的总数,但至少,我们知道有 18 个正确位置(总共 30 个位置),因为提取器已达到这个值。但是在集合中可能有超过 18 个正确的位置,可能是 19、20、21、22 或 23。从 24 到 30 是不可能的,因为,至少我们知道有 6 个不正确的位置(因为提取器有达到了这个数字)。

然后,通过排除可能性来选择答案。由于P=0.75,那么我们只有两种可能:R=0.60或R=0.50。

如果我们测试可能的值,我们有:

R=18/18=1.0, R=18/19=0.94, R=18/20=0.9, R=18/21= 0.85,

R=18/22=0.81, R=18/23=0.78.

由于R既不能是0.5也不能是0.6,所以这个问题没有可能的答案。

另外,你问题中的建议解,即R = 0.75,也是不可能的。

希望对您有所帮助!