如何删除 python 中字典列表的重复元素

Question

我有一个校园列表：

campus = [{'id': '1', 'dlin': '1'}, {'id': '2', 'dlin': '1'},{'id': '3', 'dlin': '1'},{'id': '4', 'dlin': '2'},{'id': '5', 'dlin': '2'},{'id': '6', 'dlin': '1'}, ]

每个校区都属于一所具有独特 dlin 的学校。我想要一个列表，其中有一些其他列表，每个列表都有一些字典。我运行下面的代码：

schools = []
for i in campus:
    ls = []
    for j in campus:
        if i['dlin'] == j['dlin']:
            ls.append(j)
            # campus_copy.remove(j)
    schools.append(ls)
[print(item) for item in schools]

结果是：

[{'id': '1', 'dlin': '1'}, {'id': '2', 'dlin': '1'}, {'id': '3', 'dlin': '1'}, {'id': '6', 'dlin': '1'}]
[{'id': '1', 'dlin': '1'}, {'id': '2', 'dlin': '1'}, {'id': '3', 'dlin': '1'}, {'id': '6', 'dlin': '1'}]
[{'id': '1', 'dlin': '1'}, {'id': '2', 'dlin': '1'}, {'id': '3', 'dlin': '1'}, {'id': '6', 'dlin': '1'}]
[{'id': '4', 'dlin': '2'}, {'id': '5', 'dlin': '2'}]
[{'id': '4', 'dlin': '2'}, {'id': '5', 'dlin': '2'}]
[{'id': '1', 'dlin': '1'}, {'id': '2', 'dlin': '1'}, {'id': '3', 'dlin': '1'}, {'id': '6', 'dlin': '1'}]

我必须从学校中删除重复的成员或修改代码，这样我就不会得到重复的成员。当我尝试从学校中删除重复项时，我发现 dic 项目不可散列，所以我不能这样做。可以使用与我的问题有些相似的解决方案。 Remove duplicate dict in list in Python 但是，我不知道该怎么办？有人知道如何解决这个问题吗？

我期望得到的是：

[{'id': '1', 'dlin': '1'}, {'id': '2', 'dlin': '1'}, {'id': '3', 'dlin': '1'}, {'id': '6', 'dlin': '1'}]
[{'id': '4', 'dlin': '2'}, {'id': '5', 'dlin': '2'}]

Answer 1

一种可能的解决方案是将 dlin 作为键存储在字典中（并且字典不能有多个相等的键）而不是事后显式删除重复项：

campus = [{'id': '1', 'dlin': '1'}, {'id': '2', 'dlin': '1'},{'id': '3', 'dlin': '1'},{'id': '4', 'dlin': '2'},{'id': '5', 'dlin': '2'},{'id': '6', 'dlin': '1'}, ]

schools = {}
for c in campus:
    schools.setdefault(c['dlin'], []).append(c)

for s in schools.values():
    print(s)

打印：

[{'id': '1', 'dlin': '1'}, {'id': '2', 'dlin': '1'}, {'id': '3', 'dlin': '1'}, {'id': '6', 'dlin': '1'}]
[{'id': '4', 'dlin': '2'}, {'id': '5', 'dlin': '2'}]

Answer 2

根据 Andrej 的回答，我解决了我的问题的另一部分，我想在这里分享一下：

我的问题：

我现在正在处理与上一个问题相关的另一个问题：

我有这个词典列表，每个校区的信息。多个校区可能属于一所学校。我必须根据他们名字的相似性来区分和聚类。

campus = [
{'id': '1', 'name': 'seneca - york'}, 
{'id': '2', 'name': 'seneca college - north gate campus'},
{'id': '3', 'name': 'humber college - toronto campus'},
{'id': '4', 'name': 'humber college'},
{'id': '5', 'name': 'humber collge - waterloo campus'},
{'id': '6', 'name': 'university of waterloo toronto campus'}, 
]

我的预期结果可以通过这个小而整洁的代码来实现：

schools = {}
for c in campus:
    schools.setdefault(c['name'][:4], []).append(c)
print(schools)

如何删除 python 中字典列表的重复元素

How to remove duplicate elements of, list of dictionaries in python

python

dictionary

list

duplicates

hashable