根据另一个列表中的值从元组列表中删除重复值

remove duplicate value from list of tuples based on values from another list

我有 2 个与这些类似的列表:

l1 = [('zero', 0),('one', 2),('two', 3),('three', 3),('four', 5)]
l2 = [('zero', 0),('one', 3),('four', 2),('ten', 3),('twelve', 8)]

我想比较列表和

  1. 如果两个值相同,则从两者中删除重复项
  2. 如果第一个值匹配,则从列表中移除第二个值较低的元组

我可以用

做第一个
l3 = [(a,b) for (a,b) in l1 if (a,b) not in l2]
l4 = [(a,b) for (a,b) in l2 if (a,b) not in l1]

或使用 set 尽管它不保留顺序

l3 = set(l1) - set(l2)

但我很难弄清楚第二个。我尝试从

的第一个值开始删除
l3 = [(a,b) for (a,b) in l1 if a not in l2]

但这不起作用。我想要的 l3 和 l4 输出是:

l3
[('two', 3),('three', 3),('four', 5)]

l4
[('one', 3),('ten', 3),('twelve', 8)]

如有任何指导,我们将不胜感激。

你可以这样做:

d1 = dict(l1)
d2 = dict(l2)

l3 = [(k, v) for k, v in d1.items() if k not in d2 or d2[k] < v]
l4 = [(k, v) for k, v in d2.items() if k not in d1 or d1[k] < v]

print(l3)
print(l4)

输出

[('two', 3), ('three', 3), ('four', 5)]
[('one', 3), ('ten', 3), ('twelve', 8)]

想法是使用字典快速查找匹配的第一个值(如果有),然后检查对应的第二个值是否小于当前列表中的值。

您可以将两个列表放在一个字典中,比较键下的值并构建您的输出列表:

l1 = [('zero', 0),('one', 2),('two', 3),('three', 3),('four', 5)]
l2 = [('zero', 0),('one', 3),('four', 2),('ten', 3),('twelve', 8)]

# using dicts as lookups needs some performance to build them but then is faster then
# pure list lookups
d1 = dict(l1)
d2 = dict(l2)

# collect things to delete in sets
del1 = set()
del2 = set()

for key in set(d1.keys()).union(d2):
    if key in d1 and key in d2:
        if d1[key] == d2[key]:
            del1.add((key, d1[key]))
            del2.add((key, d1[key]))
            continue

        elif d2[key] >= d1[key]:
            del1.add((key, d1[key]))

        else:
            del2.add((key, d2[key]))

# create the resulting lists
l3 = [i for i in l1 if i not in del1]
l4 = [i for i in l2 if i not in del2]

print(l3) 
print(l4)

输出:

[('two', 3), ('three', 3), ('four', 5)]
[('one', 3), ('ten', 3), ('twelve', 8)]

l5 = list(set([i for i in l3 for y in l4 if (i[0]==y[0] and i[1] > y[1]) or (i[0] not in [x[0] for x in l4]) ]))
l6 = list(set([i for i in l4 for y in l3 if (i[0]==y[0] and i[1] > y[1]) or (i[0] not in [x[0] for x in l3]) ]))

print(l5)
print(l6)

>>> [('three', 3), ('four', 5), ('two', 3)]
>>> [('ten', 3), ('twelve', 8), ('one', 3)]

解释:

对于要添加到新列表的元素,任一条件:

(i[0]==y[0] and i[1] > y[1]) or (i[0] not in [x[0] for x in l4])必须为真,

il3中的元素,yl4中的元素这个条件是首先如果第一个值匹配,第二个值匹配i 大于 y 的第二个值,然后将其添加到满足您问题部分的列表中

如果第一个值匹配,则从列表中删除第二个值较低的元组

然后条件的第二部分只是添加不在另一个列表中的元素。

我对列表应用了相同的逻辑l6