读取格式良好的文本文件

Reading a well-formatted text file

鉴于下面名为 input.txt 的格式良好的文本文件:

Yesterday snowed
Today is hot
Tomorrow will rain
Next week will earthquake

如果我不知道每个英文单词的长度,我如何逐行读取文本文件并动态分配内存给每个英文单词作为字符数组,因为我不想浪费 1000 个字节简短的词。在这种情况下应该使用 realloc 吗?以下是我的代码:



    int main() {
         FILE* pfile = fopen("input.txt", "r");
         int i = 0;
         while (i != 0) {
              char* stringLiteral = (char*) malloc(1000 * sizeof(char));
              i = fscanf(pfile, "%s", stringLiteral);
              insertString(stringLiteral);
         }
         fclose("input.txt");
         return 1;
    }
    
    void insertString(char* charArray) {
         /*This function inserts a char array to a linked list*/
    }

如果您愿意,可以使用 realloc,是的,在那种情况下,您需要重新分配更小的内存。

您甚至可以通过 char 拉伸正在填充的字符串来重新分配 char,而不浪费一个字节。

带有注释的示例:

Live demo

#include <stdio.h>
#include <stdlib.h>

int main() {
    FILE *pfile = fopen("input.txt", "r");

    if (pfile == NULL) { //check for errors in opening file
        perror("fopen");
    }
    else {
        int c;
        int i = 0; //string iterator
        char *stringLiteral;
        stringLiteral = malloc(1); //initial allocation
        if(stringLiteral == NULL) {
            perror("malloc");
            return EXIT_FAILURE;
        }
        while ((c = fgetc(pfile)) != EOF) { //until the end of the file is reached
            if (c != '\n') { //until the line ends
                stringLiteral = realloc(stringLiteral, i + 1); //keep reallocating memory for each character
                if(stringLiteral == NULL){ 
                    perror("malloc");
                    return EXIT_FAILURE;
                }
                stringLiteral[i] = c; //assing the read character to the char array
                i++; 
            }
            else { //'\n' was reached
                stringLiteral[i] = '[=10=]'; //terminate string
                //insertString(stringLiteral); //your insertion function
                printf("%s\n", stringLiteral); //test print
                i = 0;
            }
        }
        //insertString(stringLiteral); //last read line
        printf("%s\n", stringLiteral); // test print
        
        fclose(pfile);
    }
    return EXIT_SUCCESS;
}

这里的问题是内存分配是一个昂贵的过程并且会减慢你的程序。

您必须权衡更重要的因素,space 或速度。除非字符串太大以至于无法放入堆栈,否则内存分配是可行的方法,尽管分配字节块而不是逐字节分配更明智。