Jaro相似度
Jaro Similarity
为了寻找 Jaro 相似度,我找到了如下匹配的字符
matching charecters in string 1 : AABABCAAAC
matching charecters in string 2 : ABAACBAAAC
t(0.5*transpositions) 的值是多少?
(来源:维基百科)
在此上下文中的换位是所有那些不匹配字符串相同位置的字符
来自 wikipedia
m = 10
t = 4/2 = 2
|S1| = 10
|S2| = 10
d = 1/3 * (10/10 + 10/10 + (10-2)/10) = 0.933
这些转置是[A/B、B/A、B/C、C/B]所以t
是用|[A/B, B/A, B/C, C/B]| / 2
计算的。
为了寻找 Jaro 相似度,我找到了如下匹配的字符
matching charecters in string 1 : AABABCAAAC
matching charecters in string 2 : ABAACBAAAC
t(0.5*transpositions) 的值是多少? (来源:维基百科)
在此上下文中的换位是所有那些不匹配字符串相同位置的字符
来自 wikipedia
m = 10
t = 4/2 = 2
|S1| = 10
|S2| = 10
d = 1/3 * (10/10 + 10/10 + (10-2)/10) = 0.933
这些转置是[A/B、B/A、B/C、C/B]所以t
是用|[A/B, B/A, B/C, C/B]| / 2
计算的。