我如何解决我所做的这段代码中散列中的冲突？目前无法只搜索吴谢也的ID

Question

我有以下文本文件

1171203258:HOSSAIN, MARUF
1181202660:KUHAN RAJ A/L TAMIL CHEL WAM
1181203465:PONG KAI SUN
1191102443:FAIZA OSAMA ABDALLA HASHIM
1201302289:LEE JIA WEI
1201302368:SHEIKH, AHNAF AZMAIN
1201100584:HI CHIA LING
1201101509:NG CHEA YEAT
1191103201:PHUAH CHEE HAOU
1201100879:MOSTAFA ARABY MADBOULY AHMED
1191103215:TONG JUN YANG
1191103119:ANG QIZHENG
1171302286:DARWIN KUMAR A/L MUNIAN
1181101192:HAIZUN NAJWA BINTI MOHD RIFIN
1201100926:NG XUE NIE
1191302417:ALMARHOON, ALI HUSSAIN A
1201100225:HEMAN RAO A/L SUBRAMANIAM
1181100823:LIM ZHEN BANG
1161202587:SOHEIL PRAKASAN SUPPAN
1201100603:AVINASH MURALI
1181101858:CHEAH KOK YEW
1191103071:GAN WEI TONG
1201100301:KEVIN THAM ZHENG YIT
1201100648:LIM CHER AIK
1201302222:SHIVAA RUTRAN A/L NAGATHEESAN
1201100779:TAN WEI XIANG
1191100919:WONG HONG WEI

我现在拥有的代码运行良好，但我认为在散列中存在冲突

这是我目前的情况：

#include<stdio.h>
#include<stdlib.h>
#include<string.h>
#define MDIR 27 //size of list
#define MBUFF 256
#define MHASH 109 //hash function is %109
#define MNAME 40 



struct List{
    char name[40];
    int studID;
};

//function prototype
int comparator(const void* p, const void* q){
    return strcmp(((struct List*)p)->name,((struct List*)q)->name);
}
int readData(struct List dir[]);  
int hashfunc(char *name);
void hash(struct List dir[], int ndir,
int hashtable[]);

int search(char *key,
struct List s[], int hashtable[]);

//main function
int main(){
    int ndir, result, hashtable[MHASH];
    int count;
    int i;
    int j;
    struct List s[27];
    char temp[27];
    char query[40];
    
    FILE *fptr;
    fptr = fopen("rec.txt", "r+");
    if (fptr != NULL) {
    printf("File created successfully!\n");
  }
  else {
    printf("Failed to create the file.\n");
    // exit status for OS that an error occurred
    return -1;
  }
  
   for(count = 0; count < 27; count++){
       fscanf(fptr,"%d", &s[count].studID);
       fgets(s[count].name,40,fptr);
       
   }

qsort

   qsort(s,27,sizeof(struct List),comparator);

打印排序后的名称然后继续搜索的散列

            //printing sorted name
            printf("Sorted Names\n");
            for(i=0;i<27;i++){
                printf("%d%s\n", i+1, s[i].name);
                }
                fclose(fptr);

搜索部分的散列

ndir=readData(s);
hash(s,ndir,hashtable);
puts("\nName to search>>");
fgets(query,MNAME-1,stdin);
query[strlen(query)-1]='[=14=]';
result=search(query,s,hashtable);
if(result==-1)
printf("Not Found");
else
printf("%s's ID is %d\n",
s[result].name, s[result].studID);
    
                return 0;
        }

读取函数

int readData(struct List dir[]){

FILE *fdir=fopen("rec.txt","r");
char buff[MBUFF];
int i=0;
while(i<MDIR && fgets(buff,MBUFF-1,fdir)){
dir[i].studID=atol(strtok(buff,":"));   
strcpy(dir[i].name,strtok(NULL, "\n"));
i++;
}
return(i);
}

哈希函数

int hashfunc(char *name){
long sum=0;
int k=0;
while(name[k]){
sum+=name[k];
k++;
}
return( (int) (sum % MHASH) );
}

哈希函数

void hash(struct List dir[], int ndir,
int hashtable[]){
int k;
int index;
for(k=0;k<ndir;k++){
index = hashfunc(dir[k].name);
hashtable[index]=k;
}
}

搜索功能

int search(char *key, struct List dir[],
int hashtable[]){
int index=hashfunc(key);
int k=hashtable[index];
if(strcmp(key,dir[k].name)==0)
return(k);
else
return(-1);

}

我不确定搜索部分的散列

Answer 1

您必须逐行获取文件并将其存储在数组中。

     FILE *fp = fopen("lorem.txt", "r");
     if(fp == NULL) {
         perror("Unable to open file!");
         exit(1);
     }
 
     char chunk[128];
 
     while(fgets(chunk, sizeof(chunk), fp) != NULL) {
         fputs(chunk, stdout);
         fputs("|*\n", stdout);  // marker string used to show where the content the chunk array has ended
     }
 
     fclose(fp);

要拆分每一行，请使用 strtok() 函数：

char *token = strtok(line, ":");  // To separate the first block from the second like seen on your image.
char *token[1] = strtok(token, ","); // To separate the other part

Answer 2

每当需要分隔一行数据中的字段时，通常的做法是将整行数据作为字符串读入缓冲区（字符数组）。然后，您使用最适合数据的任何方法将您需要的内容从缓冲区中分离出来。使用一对指针将您需要的文本括起来，然后复制指针之间的字符。您可以使用 strchr() 等字符串函数自动执行此过程，以在缓冲区中找到 ':'。您还可以使用 strtok() 等字符串函数将缓冲区拆分为任何给定分隔符集上的标记。

不过这里有一个更简单的方法。由于行中的 studID 和 name 具有固定格式，因此您可以简单地使用 sscanf()，例如

#include <stdio.h>
#include <stdlib.h>

#define MXSTUD 30       /* if you need a constant, #define one (or more) */
#define MXNAME 40

typedef struct list {   /* adding typedef for convenience */
  char name[MXNAME];
  unsigned studID;
} list;

...

int main (int argc, char **argv) {
  
  int count = 0;                      /* count of students */
  char buf[MXNAME * 2];               /* temprorary storage for line */
  list s[MXSTUD] = {{ .name = "" }};  /* list array initialized all 0 */
  /* open filename given as 1st argument or "rec.text" if none given */
  FILE *fptr = fopen (argc > 1 ? argv[1] : "rec.text", "r");
  
  if (!fptr) {  /* validate file open for reading */
    fputs ("error: file open failed\n", stderr);
    return 1;
  }
  
  while (fgets (buf, sizeof buf, fptr)) { /* read each line into buf */
    /* separate studID and name using sscanf() */
    if (sscanf (buf, "%u:%39[^\n]", &s[count].studID, s[count].name) == 2) {
      count += 1;   /* increment count on success */
    }
  }
  ...

这就是读取每一行数据并将该行分成 studID 和 name 并将每个存储在结构的 list 数组的一个元素中所需的全部内容。

使用 qsort() 进行排序

无论您是否拥有包含对象的数组或分配的内存块，qsort() 都提供了一种简单有效的排序方式。您需要做的就是编写一个 compare() 函数，告诉 qsort() 如何比较元素。 qsort() 比较函数的声明是：

int compare (const void *a, const void *b);`

其中 a 和 b 是要比较的数组的简单 pointers-to 元素。因此，在编写函数时，您需要做的就是将 a 和 b 转换为正确的类型，然后编写逻辑来比较这两个元素中您喜欢的任何内容。负数 return 表示 a 在 b 之前排序，正数 return 表示 b 在 a 之前排序。零 return 表示元素相等。

将 a 和 b 转换为类型 const list * （您包括 const 因为数据未被修改，这允许编译器自由地更充分地优化），您只需遍历每个 name 比较字符，并在两个字符不同或到达文件末尾时 returning 。在这里，要按 name 对 s[] 数组进行排序，您可以执行以下操作：

/* qsort compare function lexagraphically sorts words */
int compare (const void *a, const void *b)
{
  /* a & b are pointers to adjacent list elements, (pointers to list) */
  const list *sa = (const list *)a,
             *sb = (const list *)b;
  
  const char *na = sa->name,    /* pointers to name in each element */
             *nb = sb->name;
  
  /* loop advancing a character in each word per-iteration */
  for (;; na++, nb++) {
    /* if characters differ or at end of either */
    if (*na != *nb || !*na)
      break;
  }
  
  return (*na > *nb) - (*na < *nb);   /* return sort order */
}

然后用 qsort() 对 list 数组（你的 s[] 数组）进行排序，所需要的只是：

  qsort (s, count, sizeof *s, compare);   /* sort array by name */

将它们放在一个简短的程序中，该程序从作为程序的第一个参数给出的文件名中读取（如果没有给出参数，则默认从 "rec.text" 读取），你可以这样做：

#include <stdio.h>
#include <stdlib.h>

#define MXSTUD 30       /* if you need a constant, #define one (or more) */
#define MXNAME 40

typedef struct list {   /* adding typedef for convenience */
  char name[MXNAME];
  unsigned studID;
} list;

/* qsort compare function lexagraphically sorts words */
int compare (const void *a, const void *b)
{
  /* a & b are pointers to adjacent list elements, (pointers to list) */
  const list *sa = (const list *)a,
             *sb = (const list *)b;
  
  const char *na = sa->name,    /* pointers to name in each element */
             *nb = sb->name;
  
  /* loop advancing a character in each word per-iteration */
  for (;; na++, nb++) {
    /* if characters differ or at end of either */
    if (*na != *nb || !*na)
      break;
  }
  
  return (*na > *nb) - (*na < *nb);   /* return sort order */
}

int main (int argc, char **argv) {
  
  int count = 0;                      /* count of students */
  char buf[MXNAME * 2];               /* temprorary storage for line */
  list s[MXSTUD] = {{ .name = "" }};  /* list array initialized all 0 */
  /* open filename given as 1st argument or "rec.text" if none given */
  FILE *fptr = fopen (argc > 1 ? argv[1] : "rec.text", "r");
  
  if (!fptr) {  /* validate file open for reading */
    fputs ("error: file open failed\n", stderr);
    return 1;
  }
  
  while (fgets (buf, sizeof buf, fptr)) { /* read each line into buf */
    /* separate studID and name using sscanf() */
    if (sscanf (buf, "%u:%39[^\n]", &s[count].studID, s[count].name) == 2) {
      count += 1;   /* increment count on success */
    }
  }
  
  qsort (s, count, sizeof *s, compare);   /* sort array by name */
  
  for (int i = 0; i < count; i++) {   /* output results */
    printf ("%2d  %10u  %s\n", i + 1, s[i].studID, s[i].name);
  }
}

(注意:您只需要以读取模式打开文件"r")

例子Use/Output

如果您的数据位于名为 dat/studIDlist.txt 的文件中，对于您数据中的 27 名学生，您将得到：

$ ./bin/studIDlist dat/studIDlist.txt
 1  1191302417  ALMARHOON, ALI HUSSAIN A
 2  1191103119  ANG QIZHENG
 3  1201100603  AVINASH MURALI
 4  1181101858  CHEAH KOK YEW
 5  1171302286  DARWIN KUMAR A/L MUNIAN
 6  1191102443  FAIZA OSAMA ABDALLA HASHIM
 7  1191103071  GAN WEI TONG
 8  1181101192  HAIZUN NAJWA BINTI MOHD RIFIN
 9  1201100225  HEMAN RAO A/L SUBRAMANIAM
10  1201100584  HI CHIA LING
11  1171203258  HOSSAIN, MARUF
12  1201100301  KEVIN THAM ZHENG YIT
13  1181202660  KUHAN RAJ A/L TAMIL CHEL WAM
14  1201302289  LEE JIA WEI
15  1201100648  LIM CHER AIK
16  1181100823  LIM ZHEN BANG
17  1201100879  MOSTAFA ARABY MADBOULY AHMED
18  1201101509  NG CHEA YEAT
19  1201100926  NG XUE NIE
20  1191103201  PHUAH CHEE HAOU
21  1181203465  PONG KAI SUN
22  1201302368  SHEIKH, AHNAF AZMAIN
23  1201302222  SHIVAA RUTRAN A/L NAGATHEESAN
24  1161202587  SOHEIL PRAKASAN SUPPAN
25  1201100779  TAN WEI XIANG
26  1191103215  TONG JUN YANG
27  1191100919  WONG HONG WEI

我如何解决我所做的这段代码中散列中的冲突？目前无法只搜索吴谢也的ID

How can I resolve the collision in the hashing in this code I did? Currently cannot search for NG CHEA YEAT's ID only

c

hash

hash-collision

我现在拥有的代码运行良好，但我认为在散列中存在冲突