根据另一个列表中的值从元组列表中删除重复值
remove duplicate value from list of tuples based on values from another list
我有 2 个与这些类似的列表:
l1 = [('zero', 0),('one', 2),('two', 3),('three', 3),('four', 5)]
l2 = [('zero', 0),('one', 3),('four', 2),('ten', 3),('twelve', 8)]
我想比较列表和
- 如果两个值相同,则从两者中删除重复项
- 如果第一个值匹配,则从列表中移除第二个值较低的元组
我可以用
做第一个
l3 = [(a,b) for (a,b) in l1 if (a,b) not in l2]
l4 = [(a,b) for (a,b) in l2 if (a,b) not in l1]
或使用 set
尽管它不保留顺序
l3 = set(l1) - set(l2)
但我很难弄清楚第二个。我尝试从
的第一个值开始删除
l3 = [(a,b) for (a,b) in l1 if a not in l2]
但这不起作用。我想要的 l3 和 l4 输出是:
l3
[('two', 3),('three', 3),('four', 5)]
l4
[('one', 3),('ten', 3),('twelve', 8)]
如有任何指导,我们将不胜感激。
你可以这样做:
d1 = dict(l1)
d2 = dict(l2)
l3 = [(k, v) for k, v in d1.items() if k not in d2 or d2[k] < v]
l4 = [(k, v) for k, v in d2.items() if k not in d1 or d1[k] < v]
print(l3)
print(l4)
输出
[('two', 3), ('three', 3), ('four', 5)]
[('one', 3), ('ten', 3), ('twelve', 8)]
想法是使用字典快速查找匹配的第一个值(如果有),然后检查对应的第二个值是否小于当前列表中的值。
您可以将两个列表放在一个字典中,比较键下的值并构建您的输出列表:
l1 = [('zero', 0),('one', 2),('two', 3),('three', 3),('four', 5)]
l2 = [('zero', 0),('one', 3),('four', 2),('ten', 3),('twelve', 8)]
# using dicts as lookups needs some performance to build them but then is faster then
# pure list lookups
d1 = dict(l1)
d2 = dict(l2)
# collect things to delete in sets
del1 = set()
del2 = set()
for key in set(d1.keys()).union(d2):
if key in d1 and key in d2:
if d1[key] == d2[key]:
del1.add((key, d1[key]))
del2.add((key, d1[key]))
continue
elif d2[key] >= d1[key]:
del1.add((key, d1[key]))
else:
del2.add((key, d2[key]))
# create the resulting lists
l3 = [i for i in l1 if i not in del1]
l4 = [i for i in l2 if i not in del2]
print(l3)
print(l4)
输出:
[('two', 3), ('three', 3), ('four', 5)]
[('one', 3), ('ten', 3), ('twelve', 8)]
l5 = list(set([i for i in l3 for y in l4 if (i[0]==y[0] and i[1] > y[1]) or (i[0] not in [x[0] for x in l4]) ]))
l6 = list(set([i for i in l4 for y in l3 if (i[0]==y[0] and i[1] > y[1]) or (i[0] not in [x[0] for x in l3]) ]))
print(l5)
print(l6)
>>> [('three', 3), ('four', 5), ('two', 3)]
>>> [('ten', 3), ('twelve', 8), ('one', 3)]
解释:
对于要添加到新列表的元素,任一条件:
(i[0]==y[0] and i[1] > y[1]) or (i[0] not in [x[0] for x in l4])
必须为真,
i
是l3
中的元素,y
是l4
中的元素这个条件是首先如果第一个值匹配,第二个值匹配i
大于 y
的第二个值,然后将其添加到满足您问题部分的列表中
如果第一个值匹配,则从列表中删除第二个值较低的元组
然后条件的第二部分只是添加不在另一个列表中的元素。
我对列表应用了相同的逻辑l6
我有 2 个与这些类似的列表:
l1 = [('zero', 0),('one', 2),('two', 3),('three', 3),('four', 5)]
l2 = [('zero', 0),('one', 3),('four', 2),('ten', 3),('twelve', 8)]
我想比较列表和
- 如果两个值相同,则从两者中删除重复项
- 如果第一个值匹配,则从列表中移除第二个值较低的元组
我可以用
做第一个l3 = [(a,b) for (a,b) in l1 if (a,b) not in l2]
l4 = [(a,b) for (a,b) in l2 if (a,b) not in l1]
或使用 set
尽管它不保留顺序
l3 = set(l1) - set(l2)
但我很难弄清楚第二个。我尝试从
的第一个值开始删除l3 = [(a,b) for (a,b) in l1 if a not in l2]
但这不起作用。我想要的 l3 和 l4 输出是:
l3
[('two', 3),('three', 3),('four', 5)]
l4
[('one', 3),('ten', 3),('twelve', 8)]
如有任何指导,我们将不胜感激。
你可以这样做:
d1 = dict(l1)
d2 = dict(l2)
l3 = [(k, v) for k, v in d1.items() if k not in d2 or d2[k] < v]
l4 = [(k, v) for k, v in d2.items() if k not in d1 or d1[k] < v]
print(l3)
print(l4)
输出
[('two', 3), ('three', 3), ('four', 5)]
[('one', 3), ('ten', 3), ('twelve', 8)]
想法是使用字典快速查找匹配的第一个值(如果有),然后检查对应的第二个值是否小于当前列表中的值。
您可以将两个列表放在一个字典中,比较键下的值并构建您的输出列表:
l1 = [('zero', 0),('one', 2),('two', 3),('three', 3),('four', 5)]
l2 = [('zero', 0),('one', 3),('four', 2),('ten', 3),('twelve', 8)]
# using dicts as lookups needs some performance to build them but then is faster then
# pure list lookups
d1 = dict(l1)
d2 = dict(l2)
# collect things to delete in sets
del1 = set()
del2 = set()
for key in set(d1.keys()).union(d2):
if key in d1 and key in d2:
if d1[key] == d2[key]:
del1.add((key, d1[key]))
del2.add((key, d1[key]))
continue
elif d2[key] >= d1[key]:
del1.add((key, d1[key]))
else:
del2.add((key, d2[key]))
# create the resulting lists
l3 = [i for i in l1 if i not in del1]
l4 = [i for i in l2 if i not in del2]
print(l3)
print(l4)
输出:
[('two', 3), ('three', 3), ('four', 5)]
[('one', 3), ('ten', 3), ('twelve', 8)]
l5 = list(set([i for i in l3 for y in l4 if (i[0]==y[0] and i[1] > y[1]) or (i[0] not in [x[0] for x in l4]) ]))
l6 = list(set([i for i in l4 for y in l3 if (i[0]==y[0] and i[1] > y[1]) or (i[0] not in [x[0] for x in l3]) ]))
print(l5)
print(l6)
>>> [('three', 3), ('four', 5), ('two', 3)]
>>> [('ten', 3), ('twelve', 8), ('one', 3)]
解释:
对于要添加到新列表的元素,任一条件:
(i[0]==y[0] and i[1] > y[1]) or (i[0] not in [x[0] for x in l4])
必须为真,
i
是l3
中的元素,y
是l4
中的元素这个条件是首先如果第一个值匹配,第二个值匹配i
大于 y
的第二个值,然后将其添加到满足您问题部分的列表中
如果第一个值匹配,则从列表中删除第二个值较低的元组
然后条件的第二部分只是添加不在另一个列表中的元素。
我对列表应用了相同的逻辑l6