使特定元素唯一的元组序列

Making a sequence of tuples unique by a specific element

所以我有一个元组的元组

a = ((1, 2), (7, 2), (5, 2), (3, 4), (8, 4))

我想从 'a' 中删除具有共同第二个元素的所有元组,除了一个(其中任何一个)。

对于上面的例子,我想要新的输出 a = ((1,2),(3,4))

换句话说,我想消除在元组的第二个位置被认为是重复元素的元组。

我想知道实现此目的的最有效方法,也想知道我是否可以用列表而不是元组来做同样的事情?

您可以从您的元素中创建一个 字典 ,将您希望唯一的任何内容作为键,然后提取值。这适用于 'unique' 子元素可散列的任何内容。整数是可散列的:

def unique_by_key(elements, key=None):
    if key is None:
        # no key: the whole element must be unique
        key = lambda e: e
    return {key(el): el for el in elements}.values()

这个函数非常通用;它可以用于通过任何特征提取 'unique' 元素,只要 key 可调用 returns 可以用作字典中的键。不会保留顺序,目前每个键的最后一个元素获胜。

使用上述函数,您可以使用 operator.itemgetter() object 或 lambda 从每个元素中提取第二个值。这适用于元组序列和列表序列:

from operator import itemgetter

unique_by_second_element = unique_by_key(a, key=itemgetter(1))

演示:

>>> from operator import itemgetter
>>> a = ((1, 2), (7, 2), (5, 2), (3, 4), (8, 4))
>>> unique_by_key(a, key=itemgetter(1))
[(5, 2), (8, 4)]
>>> b = [[1, 2], [7, 2], [5, 2], [3, 4], [8, 4]]
>>> unique_by_key(b, key=itemgetter(1))
[[5, 2], [8, 4]]

注意函数总是returns一个list;您始终可以通过对结果调用 tuple() 将其转换回来。