读取文本文件,将每一行分成单独的数组并在 C 中排序

Read text file, break each line into separate arrays and sort in C

我正在尝试编写一个程序来读取文本文件并将每一行分成单独的数组,以便可以按日期和名称对它们进行排序。我仍然无法将 'sort by date' 函数正确设置为 work/display,这就是为什么我还没有尝试按名称排序函数的原因。

我似乎能够很好地扫描日期和名称数组,但我认为我需要修改我在最后一个数组 'dates' 中扫描的方式,因为我需要用 [= 分隔它们26=] 在逗号之后。问题是我不确定如何将它们扫描为字符串,因为它们之间会有 spaces,而且一些名称具有不同数量的状态。 (此时我删除了文本文件中状态之间的 spaces,但文本文件可能需要将它们放回原处?)

到目前为止我的代码...

#include <stdio.h>
#include <string.h>

#define MAX 30

void sortByDate( int year[], char *name[], char *states[], int count);
void sortByName(int year[], char name[], char states[], int count);

int main()
{
     int year[MAX]; 
     int i, a;
     int count = 0;
     int choice;
     char *name[MAX],
          *states[MAX];
     char b[MAX], c[MAX];

     FILE *inp = fopen("hurricanes.txt","r");               /* defining file input    */

     for(i=0;i<MAX;i++)
     {
         if( feof(inp) )
        {
            break;
        } 
        fscanf(inp, "%d", &a);
        fscanf(inp, "%s", &b);
        fscanf(inp, "%s", &c);
        year[i]=a;
        strcpy(&name[i],b);
        strcpy(&states[i],c);
        ++count; 

        printf("%d %s %s\n", year[i], &name[i], &states[i]);
     }

     printf("Press 0 to sort by date or 1 to sort by name: ");
     scanf("%d", &choice);  
     if (choice == 0)
     {
         sortByDate(year, name, states, count); 
     }
     else if ( choice == 1)
     {
          //sortByName(year, name, states, count); 
     }

     getch();
     return 0;
}

void sortByDate( int year[], char *name[], char *states[], int count )
{
     int d = 0;
     int c = 0;

     int yearTmp;
     char nameTmp[MAX], statesTmp[MAX];
     int order[count];
     int tmp = 0;

     FILE *outp = fopen("report.txt","w");                 /* defining file output   */

     for (c = 0; c < count; ++c)
     {
         order[c] = c; 
     } 

     for (c = 0 ; c < ( count - 1 ); c++)
     {
          for (d = 0 ; d < count - c - 1; d++)
          {
               if (year[d] > year[d+1])
               {
                    yearTmp = year[d];
                    year[d] = year[d+1]; 
                    year[d+1] = yearTmp; 

                    tmp = order[d];
                    order[d] = order[d+1];
                    order[d+1] = tmp;   
              }
          }
     }

     for (c = 0; c < count; ++c)
     {
          printf("%d %-10s %s\n",  year[c], &name[order[c]], &states[order[c]]); 
     } 
}

//void sortByName(int year[], char name[], char states[], int count)
//{
//} 

hurricanes.txt 文件....(同样,我删除了状态之间的 spaces,但我认为它们需要放回原处并以不同方式扫描?)

1960 Donna FL,NC
1969 Camille MS
1972 Agnes FL
1983 Alicia TX
1989 Hugo SC,NC
2005 Katrina FL,LA,MS
2005 Rita TX,LA
2005 Wilma FL
2008 Ike TX
2009 Ida MS
2011 Irene NC,NJ,MA,VT
2012 Isaac LA
1992 Andrew FL,LA
1995 Opal FL,AL
1999 Floyd NC
2003 Isabel NC,VA
2004 Charley FL,SC,NC
2004 Frances FL
2004 Ivan AL
2004 Jeanne FL

好的,所以我根据此处发布的建议进行了一些更改,效果很好!

如果你的 EOL 角色是 \n,你可以使用这个:

fscanf(inp, "%d %s %29[^\n]", &a, b, c);

其中 29 是 MAX - 1。将 \n 替换为您的 EOL 字符。

请注意,您不需要将 &b, &c 传递给 fscanf,因为您的编译器会将 b 和 c 转换为 &b[0]&c[0]。 此外,在 printf 上,您传递的是 &name[i],这是一个 char **,而您的编译器期望一个 char *。您需要将 &name[i] 更改为 name[i]&states[i].

也一样

与其将值存储在单独的数组中,不如有更好的方法。每当您面对由多个相关值组成的排序数据时,您应该考虑 struct。这是 C 中的机制,它提供了一种方法来关联由多个变量组成的数据的排序。

例如,在您的情况下,您有 (1) year、(2) 飓风 name 和 (3) 飓风 path单个事件。当您的数据包含多个事件,您希望按 yearnamepath 排序时,您需要一种方法来保留哪个名称发生在哪一年和发生时间之间的相关性什么路径。像下面这样的简单结构就可以了

typedef struct {
    unsigned year;
    char name[MAXC];
    char path[MAXC];
} hcdata;

然后在您的程序中,您可以声明 数组并键入 hcdata 并使用从您的文件中读取的数据填充该数组。虽然您通常希望使用 line-oriented 输入函数(fgetsgetline)一次读取一行,但当您具有完全相同的格式时每行的信息,scanf 函数族可以提供一个现实的选择。 (它是有限的时间之一 scanffgets 的现实替代品,等等。)

为了使 fscanf 的阅读正常工作,您应该考虑正在阅读的行中的每个字符(包括 '\n')。虽然读取整数值会跳过中间的空格,但如果您养成了计算每个字符的习惯,那么当您的下一行以一个字符开头时您就不会感到惊讶。在这种情况下,您可以使用格式字符串:

    char *fmt = "%u %31[^ ] %31[^\n]%*c";

最后,qsort 是 C 库中数据排序的默认标准方式。它使用几种不同的排序方法进行了优化,这些方法针对 large/small 数据集进行了优化,这些数据集协同工作以产生极快的排序。您需要做的就是编写比较函数以传递给 qsort。使用上面的结构,要对 nameyear 进行排序,compare 函数几乎是微不足道的。例如,

int cmpname (const void *a, const void *b)
{   return strcmp (((hcdata *)a)->name, ((hcdata *)b)->name); }

int cmpyear (const void *a, const void *b)
{   return ((hcdata *)a)->year - ((hcdata *)b)->year; }

您可以根据需要使用尽可能简单的排序函数,或者您可以定制排序以在主要值之间没有差异的情况下对次要参数进行排序。例如,如果 year 相同,则按 name 字母顺序排序:

int cmpyear (const void *a, const void *b)
{   
    int diff = ((hcdata *)a)->year - ((hcdata *)b)->year;

    if (diff > 0)   /* if years differ, sort by year */
        return 1;
    else if (diff < 0)
        return -1;

    /* otherwise sort alphabetically with same year */
    return strcmp (((hcdata *)a)->name, ((hcdata *)b)->name);
}

然后排序就变得像一次调用一样简单,例如:

    qsort (hcd, idx, sizeof *hcd, cmpname);

将所有部分放在一起,您可以读取数据,按 name 排序,然后以直接的方式再次按 year 排序:

#include <stdio.h>
#include <stdlib.h>
#include <string.h>

enum { MAXC = 32, MAXL = 128 };

typedef struct {
    unsigned year;
    char name[MAXC];
    char path[MAXC];
} hcdata;

int cmpname (const void *a, const void *b);
int cmpyear (const void *a, const void *b);
void prndata (hcdata *h, size_t n);

int main (int argc, char **argv) {

    hcdata hcd[MAXL] = {{ 0, {""}, {""} }};
    size_t idx = 0;
    char *fmt = "%u %31[^ ] %31[^\n]%*c";
    FILE *fp = argc > 1 ? fopen (argv[1], "r") : stdin;

    if (!fp) {  /* validate file open for reading */
        fprintf (stderr, "error: file open failed '%s'.\n", argv[1]);
        return 1;
    }

    /* read each line of data into an array of struct */
    while (idx < MAXL && fscanf (fp, fmt,
        &hcd[idx].year, hcd[idx].name, hcd[idx].path) == 3)
        idx++;

    printf ("\noriginal file order:\n\n");
    prndata (hcd, idx);

    qsort (hcd, idx, sizeof *hcd, cmpname);    /* sort by name */
    printf ("\nsorted by hurricane name:\n\n");
    prndata (hcd, idx);

    qsort (hcd, idx, sizeof *hcd, cmpyear);    /* sort by year */
    printf ("\nsorted by year:\n\n");
    prndata (hcd, idx);

    if (fp != stdin) fclose (fp);

    return 0;
}

int cmpname (const void *a, const void *b)
{   return strcmp (((hcdata *)a)->name, ((hcdata *)b)->name); }

int cmpyear (const void *a, const void *b)
{   return ((hcdata *)a)->year - ((hcdata *)b)->year; }

void prndata (hcdata *h, size_t n)
{
    if (!h || !n) return;
    size_t i;
    for (i = 0; i < n; i++)
        printf (" y: %u    n: %-10s    p: %s\n", h[i].year,
                h[i].name, h[i].path);
}

示例Use/Output

$ ./bin/hurricanes <dat/hurricanes.txt

original file order:

 y: 1960    n: Donna         p: FL,NC
 y: 1969    n: Camille       p: MS
 y: 1972    n: Agnes         p: FL
 y: 1983    n: Alicia        p: TX
 y: 1989    n: Hugo          p: SC,NC
 y: 2005    n: Katrina       p: FL,LA,MS
 y: 2005    n: Rita          p: TX,LA
 y: 2005    n: Wilma         p: FL
 y: 2008    n: Ike           p: TX
 y: 2009    n: Ida           p: MS
 y: 2011    n: Irene         p: NC,NJ,MA,VT
 y: 2012    n: Isaac         p: LA
 y: 1992    n: Andrew        p: FL,LA
 y: 1995    n: Opal          p: FL,AL
 y: 1999    n: Floyd         p: NC
 y: 2003    n: Isabel        p: NC,VA
 y: 2004    n: Charley       p: FL,SC,NC
 y: 2004    n: Frances       p: FL
 y: 2004    n: Ivan          p: AL
 y: 2004    n: Jeanne        p: FL

sorted by hurricane name:

 y: 1972    n: Agnes         p: FL
 y: 1983    n: Alicia        p: TX
 y: 1992    n: Andrew        p: FL,LA
 y: 1969    n: Camille       p: MS
 y: 2004    n: Charley       p: FL,SC,NC
 y: 1960    n: Donna         p: FL,NC
 y: 1999    n: Floyd         p: NC
 y: 2004    n: Frances       p: FL
 y: 1989    n: Hugo          p: SC,NC
 y: 2009    n: Ida           p: MS
 y: 2008    n: Ike           p: TX
 y: 2011    n: Irene         p: NC,NJ,MA,VT
 y: 2012    n: Isaac         p: LA
 y: 2003    n: Isabel        p: NC,VA
 y: 2004    n: Ivan          p: AL
 y: 2004    n: Jeanne        p: FL
 y: 2005    n: Katrina       p: FL,LA,MS
 y: 1995    n: Opal          p: FL,AL
 y: 2005    n: Rita          p: TX,LA
 y: 2005    n: Wilma         p: FL

sorted by year:

 y: 1960    n: Donna         p: FL,NC
 y: 1969    n: Camille       p: MS
 y: 1972    n: Agnes         p: FL
 y: 1983    n: Alicia        p: TX
 y: 1989    n: Hugo          p: SC,NC
 y: 1992    n: Andrew        p: FL,LA
 y: 1995    n: Opal          p: FL,AL
 y: 1999    n: Floyd         p: NC
 y: 2003    n: Isabel        p: NC,VA
 y: 2004    n: Charley       p: FL,SC,NC
 y: 2004    n: Frances       p: FL
 y: 2004    n: Ivan          p: AL
 y: 2004    n: Jeanne        p: FL
 y: 2005    n: Katrina       p: FL,LA,MS
 y: 2005    n: Rita          p: TX,LA
 y: 2005    n: Wilma         p: FL
 y: 2008    n: Ike           p: TX
 y: 2009    n: Ida           p: MS
 y: 2011    n: Irene         p: NC,NJ,MA,VT
 y: 2012    n: Isaac         p: LA

将此处的实现与您在单个数组中的存储方法以及排序例程进行比较。虽然上面的代码依赖于静态声明的结构数组,但如果您面临读取未知数字,则没有理由不能根据需要动态声明结构。如果您还有其他问题,请告诉我。