Spacy - 实体链接器 - 为什么预测分数是 prob 和 cosine sim 的组合?

Spacy - entity linker - why is the predict score a combination of prob and cosine sim?

我在 spacy 下通过实体链接器管道的预测方法,由于某种原因,分数定义如下:

scores = prior_probs + sims - (prior_probs*sims)

Link here

有人对此有经验/知道这个公式的来源吗?

谢谢!

取自Entity Linking via Joint Encoding of Types, Descriptions, and Context第4节等式2。

虽然详细解释了公式,但我觉得不够自信,总的来说,目的是结合基于外部知识的资源(论文中的 KB)导出的实体候选者的概率分数,这是先验概率,以及使用句子编码器估计的分数,用于将提到 link 及其上下文进行编码,在公式中模拟,因为它们计算编码的提及向量与所有候选实体之间的余弦相似度(这就是为什么这个公式是仅在 "incl_context" 为真时使用)。