空终止与计数变量的优势

Advantages of null termination vs count variable

我需要使用图形数据数组,即具有 x 和 y 整数的结构。这个数组会经过很多函数,我需要决定API的选择。

typedef struct {
    int x;
    int y;
} GraphData_t;

我应该如何选择是对数组使用 NULL 终止,还是提供计数变量?

我的 API 有三种方法:

1: loadGraph(GraphData_t *data, int count); //use count variable
2: loadGraph(GraphData_t *data); // use null-termination (or any other termination value)
typedef struct {
    GraphData_t *data;
    int count;
} GraphArray_t;

3: loadGraph(GraphArray_t *data); //use a struct which has integrated count variable

到目前为止,这些对我来说似乎是一样的。哪种方法更可取,为什么?

虽然所有方法当然都可以完成工作,但有些差异可能与您的用例相关,也可能不相关。

  • 如果用户需要或想要使用硬编码数组,空终止非常方便,因为这样他们就可以添加或删除条目,而无需担心可能会破坏应用程序(除非他们当然删除了终结符)。

  • 由于大小未知,几乎每个使用空终止数组的函数都需要遍历整个数组。如果数组很大,这可能是个问题,并且许多函数实际上通常不需要访问所有条目(或者不需要按照它们的存储顺序)。

  • 终结符本身显然需要是一个永远不会出现在你的实际数据中的值。因此,根据您的数据,可能没有明显的候选者用作终结符(甚至 none)。

可能还有更多微妙的差异可能会影响您的决定,但这些是我首先想到的。

空终止是一种约定,只有当空值被排除在条目的合法值集中时才能使用。例如 main 中的字符串数组 argv 末尾有一个空指针,因为空指针不能是合法的字符串。

在您的例子中,数组元素是具有 2 个 int 坐标的结构。您需要决定哪些值对这些坐标无效。如果所有值都正确,则必须显式传递元素数。在所有情况下都首选显式传递数组长度,因为它避免了不必要的扫描。实际上 main 也获取 argv 数组的长度作为单独的 int 参数 argc.

是否将数组指针和长度封装在一个结构中是风格和方便的问题。对于复杂结构,最好将所有特征分组到一个结构中,但对于简单数组,显式传递指针和大小可能更方便,因为它允许您将函数应用到数组的子集 loadGraph(data + i, j).

作为一个比较老的恐龙,我会在这里使用历史。

无论如何,大小 + 指针惯用法是 多用途且防弹的方式。如有疑问,请使用它。

分隔方式对人类来说更常见,特别是当你想初始化一个数组时:不需要手动计算项目(如果你以后添加或删除元素到初始化列表),您只需将定界符添加为最后一个元素。顺便说一句,这是我们在文本文件中使用行的方式...但是无论如何,sizeof(array)/sizeof(array[0]) 习惯用法可以轻松自动地获取大小...

NULL 终止习语来自微处理器的开始,其中代码出于性能原因接近硬件:与 0 比较是最快的测试,内存很昂贵。出于这个原因,程序员开始以 NULL 字符结束他们的常量字符串:即使字符串超过 256 个字符,也只有一个字节的开销。您在 MS/DOS 2 手册中找到了对这个 ASCIIZ 习语的引用,但自 70 年代以来,它已被 Unix 和 K&R C 语言这对语言流行起来。

它仍然很方便,并且仍在 C 字符串中使用,但是许多更高级别的工具,如 C++ std::string 现在更喜欢 counted idiom,它不需要一个禁止值。

在日常编程中,(null) terminated idiom 只适用于数组只能向前浏览,且对数组大小没有特殊需求的情况。但请注意,如果您只是想复制一个空终止数组,则必须扫描它两次:一次扫描其大小,一次扫描其数据。