比较两列并应用 Jaro 距离
Compare two Column and apply Jaro distance
我有一个数据框,我需要应用 Jaro winkler 距离,例如 - jaro.jaro_winkler_metric(u'SHACKLEFORD', u'SHACKELFORD')
数据帧-
col1
col2
value1
value2
value3
value4
所以基本上我有两列 'col1' 和 'col2',我需要比较值 1 和值 2,比如 - jaro.jaro_winkler_metric(u'value1', u'value2')
然后是值 3 和值 4 等等,迭代应该继续直到最后一个值并在新列中获得分数
预期输出 -
col1
col2
score
value1
value2
0.88
value3
value4
0.77
df['score'] = df.apply(lambda row : jaro.jaro_winkler_metric(row['col1'],
row['col2']), axis = 1)
我有一个数据框,我需要应用 Jaro winkler 距离,例如 - jaro.jaro_winkler_metric(u'SHACKLEFORD', u'SHACKELFORD')
数据帧-
col1 | col2 |
---|---|
value1 | value2 |
value3 | value4 |
所以基本上我有两列 'col1' 和 'col2',我需要比较值 1 和值 2,比如 - jaro.jaro_winkler_metric(u'value1', u'value2')
然后是值 3 和值 4 等等,迭代应该继续直到最后一个值并在新列中获得分数
预期输出 -
col1 | col2 | score |
---|---|---|
value1 | value2 | 0.88 |
value3 | value4 | 0.77 |
df['score'] = df.apply(lambda row : jaro.jaro_winkler_metric(row['col1'],
row['col2']), axis = 1)