哈希表如何解决桶歧义和探测?

How do hash tables resolve bucket ambiguity and probes?

我正在阅读 C 中的数据结构和算法与软件原理,试图了解数据结构的一些内部结构,有两件事真正困扰着我:

(1) 如果哈希值 tables 都具有相同的哈希值,那么哈希值 tables 如何处理确定存储桶中的哪一项是您正在查找的项目?

例如

  1. 获取键、值
  2. 对key使用Hash算法找到索引尝试放入value
  3. 如果slot被占用,但是没有bucket(单项),创建一个bucket,将当前item放入bucket中,然后将当前值放入bucket中。
  4. 现在我有一个包含一堆值和一个 "lost and found problem" 的桶,你无法分辨哪个值属于哪个键,因为所有键都映射到相同的散列,并且桶中的项目有没有密钥可以通过密钥搜索存储桶。

如果存储桶为每个条目保存键和值,这将起作用,但我很困惑,因为我找不到确认散列 tables 保存键和值的站点他们的参赛作品。

(2) 哈希 tables 如何判断索引处的值是否是键的正确值,或者探测是否发现冲突并将其放在其他地方。

例如

  1. 获取键、值
  2. 查找索引的哈希键(0)
  3. 已获取索引,使用执行线性搜索的朴素探测算法,直到找到插槽(插槽 1 为空)。
  4. 现在我搜索我的密钥并找到索引 0。哈希如何知道索引 0 不是该密钥的正确项目,但它已被探测到插槽 1?

同样,如果 table 保存了条目的键和值,这对我来说很有意义,但我不确定哈希是否将键与条目的值一起保存,或者有其他方式确保哈希索引或桶索引中的项目是正确的项目,或者如果我误解了它。

澄清问题:哈希 table 是否将键与值一起保存以消除桶和探测序列的歧义,或者它们是否使用其他东西来避免哈希的歧义?

很抱歉提出了粗略的问题,但我不得不问。

提前致谢。

哈希 Tables 保存条目。条目由键和值组成。

How do hash tables deal with deciding which item in the bucket is the item you are looking up if they all have the same hash?

因为查询是通过传key完成的

散列的目的是减少查找索引的时间。他们的密钥被散列以找到正确的桶。然后,当项目从总数 N 减少到非常小的 n 时,您甚至可以执行线性搜索以从具有相同哈希值的所有键中找到正确的项目。

How do hash tables tell if the value at an index is the correct value for the key, or if probing found a collision and put it elsewhere.

同样,这是因为 Hash Table 会保存条目而不仅仅是值。如果在发生冲突的情况下,Hash Table 发现在此桶中找到的键不是查询的键,则 Hash Table 知道冲突发生得更早并且键可能在下一个桶。请注意,在这种情况下,存储桶存储单个条目,这与第一个答案的情况不同,在第一个答案中,存储桶可能存储一个 LinkedList 或一个条目树。