杰卡德系数

Jaccard Coefficient

我得到了一个计算两个长度为 n 的实数向量 a 和 b 的杰卡德系数的公​​式。

这个公式正确吗?如果我计算向量 {5, 3, 1, 0, 3} 和 {7, 1, 3, 2, 1} 的系数,我会得到一个负数,我认为这对于指标是不允许的)。

(5*7 + 3*1 + 1*3 + 0*2 + 3*1) = 44

44 / (12+ 14 - 44) = -22/9

正如 Jaccard 最初定义的那样,相似系数是交集的大小除以并集的大小。由于两者都是尺寸,显然不可能出现负结果。

你在问题中展示的内容看起来有点像位向量的 Jaccard 相似度。然而,为此你需要对分母左边的每一项进行平方,通常显示如下:

我怀疑缺少平方是导致您当前看到的问题的原因——没有它,我们通常可以预期分母为负。更具体地说,对于一项,(A + B) - (A * B) 为正,A 或 B 中至少有一个必须小于 1。