Jaro相似度

Jaro Similarity

为了寻找 Jaro 相似度,我找到了如下匹配的字符

matching charecters in string 1 :  AABABCAAAC   
matching charecters in string 2 :  ABAACBAAAC

t(0.5*transpositions) 的值是多少? (来源:维基百科)

在此上下文中的换位是所有那些不匹配字符串相同位置的字符

来自 wikipedia

m = 10
t = 4/2 = 2
|S1| = 10
|S2| = 10
d = 1/3 * (10/10 + 10/10 + (10-2)/10) = 0.933

这些转置是[A/B、B/A、B/C、C/B]所以t是用|[A/B, B/A, B/C, C/B]| / 2计算的。