模糊匹配排名

Question

我模糊匹配了一个电影片名列表，并将它们与匹配值一起编译成每个比较的另一个列表：

>>> fuzzy_matches
[(['White Warrior (Alpha Video)'], ['White Warrior (Alpha Video)'], 100), (['White Warrior (Alpha Video)'], ['White Warrior (Digiview Entertainment)'], 63), (['White Warrior (Alpha Video)'], ['White Warrior (Platinum)'], 78), (['White Warrior (Alpha Video)'], ['White Warrior (Platinum) / David And Goliath'], 63), (['White Warrior (Alpha Video)'], ['White Warrior (Platinum) / Duel Of Champions'], 61)]...etc

我想将每个标题的匹配值相加，以便得到如下输出：

>>>([White Warrior (Alpha Video)], 248),
['White Warrior 2 (Digiview Entertainment)'], 390),
etc...

我已经尝试了几种利用切片的实现，但它很丑。

（不是我的确切代码，但这是丑陋之处）：

for x in range(len(fuzzed)):
    for y in fuzzed(len(fuzzed)):

big_dict[fuzzy_matches[55][0][0]]=fuzzy_matches[55][2] + fuzzy_matches[56][3]...

完成此任务的更有效方法是什么？

Answer 1

你可以使用字典来存储你想要的结果，然后如果你想要一个元组列表，你可以使用 dict.items() (Python 3.x )得到它。

例子-

>>> fuzzy_matches = [(['White Warrior (Alpha Video)'], ['White Warrior (Alpha Video)'], 100), (['White Warrior (Alpha Video)'], ['White Warrior (Digiview Entertainment)'], 63), (['White Warrior (Alpha Video)'], ['White Warrior (Platinum)'], 78), (['White Warrior (Alpha Video)'], ['White Warrior (Platinum) / David And Goliath'], 63), (['White Warrior (Alpha Video)'], ['White Warrior (Platinum) / Du
el Of Champions'], 61)]
>>>
>>> fuzzy_dict = {}
>>> for i in fuzzy_matches:
...     if i[0][0] not in fuzzy_dict:
...             fuzzy_dict[i[0][0]] = 0
...     fuzzy_dict[i[0][0]] += i[2]
...
>>> fuzzy_dict
{'White Warrior (Alpha Video)': 365}
>>> list(fuzzy_dict.items())
[('White Warrior (Alpha Video)', 365)]

如果您使用 Python 2.x，则不需要在末尾添加 list(...)。

模糊匹配排名

Fuzzy match ranking

python

fuzzy-search

fuzzy-comparison