我不明白 K&R 中的哈希表示例
I don't understand the hash tables example in K&R
这里是 K&R 书中散列table示例中的安装函数:
struct nlist *install(char *name, char *defn)
{
struct nlist *np;
unsigned hashval;
if ((np = lookup(name)) == NULL) { /* not found */
np = (struct nlist *) malloc(sizeof(*np));
if (np == NULL || (np->name = strdup(name)) == NULL)
return NULL;
hashval = hash(name);
np->next = hashtab[hashval];
hashtab[hashval] = np;
} else /* already there */
free((void *) np->defn); /*free previous defn */
if ((np->defn = strdup(defn)) == NULL)
return NULL;
return np;
}
我不明白 line np->next = hashtab[hasvall]
我认为使用变量 np->next 的原因是为了放入 table 两个具有相同散列值的字符串,但结果是每个散列值只有一个名称。
此外,我似乎无法理解函数查找和 for 中的“AFTERTHOUGHT 部分(因为我认为表格中的每个结构只有一个值:
/* lookup: look for s in hashtab */
struct nlist *lookup(char *s)
{
struct nlist *np;
for (np = hashtab[hash(s)]; np != NULL; np = np->next)
if (strcmp(s, np->name) == 0)
return np; /* found */
return NULL; /* not found */
}
我错过了什么?
每个值只能有一个键(名称),但两个或更多键可以具有相同的哈希值。 np->next = hashtab[hashval]
将新的 hashval
添加到链表中。查找然后遍历列表,直到键(名称)匹配。
np->next = hashtab[hashval];
hashtab[hashval] = np;
这两行不是替换旧条目,而是添加到它。
hashtab[hashval]-> existing_node
变为
hashtab[hashval]-> np -(next)-> existing_node
正如@Bo Persson 在评论中提到的,这叫做“chaining”。
鉴于此结构,lookup
函数正确检查链中每个节点的名称。
这里是 K&R 书中散列table示例中的安装函数:
struct nlist *install(char *name, char *defn)
{
struct nlist *np;
unsigned hashval;
if ((np = lookup(name)) == NULL) { /* not found */
np = (struct nlist *) malloc(sizeof(*np));
if (np == NULL || (np->name = strdup(name)) == NULL)
return NULL;
hashval = hash(name);
np->next = hashtab[hashval];
hashtab[hashval] = np;
} else /* already there */
free((void *) np->defn); /*free previous defn */
if ((np->defn = strdup(defn)) == NULL)
return NULL;
return np;
}
我不明白 line np->next = hashtab[hasvall]
我认为使用变量 np->next 的原因是为了放入 table 两个具有相同散列值的字符串,但结果是每个散列值只有一个名称。
此外,我似乎无法理解函数查找和 for 中的“AFTERTHOUGHT 部分(因为我认为表格中的每个结构只有一个值:
/* lookup: look for s in hashtab */
struct nlist *lookup(char *s)
{
struct nlist *np;
for (np = hashtab[hash(s)]; np != NULL; np = np->next)
if (strcmp(s, np->name) == 0)
return np; /* found */
return NULL; /* not found */
}
我错过了什么?
每个值只能有一个键(名称),但两个或更多键可以具有相同的哈希值。 np->next = hashtab[hashval]
将新的 hashval
添加到链表中。查找然后遍历列表,直到键(名称)匹配。
np->next = hashtab[hashval];
hashtab[hashval] = np;
这两行不是替换旧条目,而是添加到它。
hashtab[hashval]-> existing_node
变为
hashtab[hashval]-> np -(next)-> existing_node
正如@Bo Persson 在评论中提到的,这叫做“chaining”。
鉴于此结构,lookup
函数正确检查链中每个节点的名称。