java HashSet 中的重复项

Duplicates in java HashSet

HashSet 中似乎允许重复。为什么会这样,我该如何删除它们,为什么下面的第二个 remove() 不起作用?一种删除所有重复项的方法是 new HashSet<>(set),但有没有更好的方法不涉及创建新对象?

Set<ArrayList<String>> set = new HashSet<>();
ArrayList<String> a1 = new ArrayList<>();
ArrayList<String> a2 = new ArrayList<>();

a1.add("a");
set.add(a1);
a1.remove("a");

set.add(a2);

System.out.println(set.size());
System.out.println(set);

ArrayList<String> a3 = new ArrayList<>();
for (Object o : set) {
    boolean b = o.equals(a3) && (o.hashCode() == a3.hashCode());
    if (!b) System.out.println(false);
}

set.remove(new ArrayList<String>());
System.out.println(set);
set.remove(new ArrayList<String>());
System.out.println(set);
set.remove(set.iterator().next());
System.out.println(set);
System.out.println(set.iterator().next() == a1);

输出:set 由两个相等的空列表组成,不能删除最初不为空的列表。

2
[[], []]
[[]]
[[]]
[[]]
true

散列发生在插入时进行分桶。如果您之后更改对象,其哈希码将更改,但它已经在其存储桶中。它不会(直接)检索,因为您将尝试使用与您用于插入它的哈希码不同的哈希码检索它。

a1.add("a"); 
set.add(a1); // hashed and bucketed
a1.remove("a"); // hash code changes but doesn't affect set

set.add(a2); // hashes to a different place than a1

元素在 HashMap 中的存储位置取决于该元素在添加时的 hashCode

如果在添加元素后,您更改了该元素的 属性 导致其 hashCode 发生变化(在 ArrayList 元素的情况下,从列表中删除一个元素正是这样做的),试图在 HashSet 中查找该元素(或删除它)将失败。

如果您修改 Map 的键或 Set 的元素,您实际上是在破坏它。集合无法知道您已更改元素或正确处理它。

如果你想修改一个键或元素,你必须先删除它,修改它并重新添加它。