什么时候可以通过 char * 相等来比较 C 字符串?

When is it okay to compare C strings by char * equality?

我知道比较两个任意的 c 字符串 (const char *) 是没有意义的 (a == b)

但我认为当两者都由相同的字符串文字定义时,这是合法的。

例如,这里:

#include <stddef.h>

const char * const meals[] = {
    "none",
    "breakfast",
    "lunch",
    "dinner"
};

#define NO_MEALS  meals[0]
#define BREAKFAST meals[1]
#define LUNCH     meals[2]
#define DINNER    meals[3]

// i hours after midnight, hour_to_meals_map[floor(i)] is being served.
const char * hour_to_meal_map[] = {
    NO_MEALS,
    NO_MEALS,
    NO_MEALS,
    NO_MEALS,
    NO_MEALS,
    BREAKFAST, // i = 5
    BREAKFAST,
    BREAKFAST,
    BREAKFAST,
    BREAKFAST,
    BREAKFAST,
    LUNCH, // i = 11
    LUNCH,
    LUNCH,
    LUNCH,
    LUNCH,
    LUNCH,
    DINNER, // i = 17
    DINNER,
    DINNER,
    DINNER,
    DINNER,
    DINNER,
    DINNER // i = 23
};

// Returns a boolean for whether the two hours have the same meal being eaten.
int same_meal(size_t hour_one, size_t hour_two) {
    return hour_to_meal_map[hour_one] == hour_to_meal_map[hour_two];
}

(至于为什么你会让 hour_to_meal_map 映射到字符串而不是索引是任何人的猜测......但我正在做一个以这种方式设置的项目。)

我是否正确认为这在这里是合法的,重要的是每个值只有一个地方是按文字写的? (#define NO_MEALS "none"是故意回避的!!)

如果此代码在头文件中,那没有什么区别,不是吗? (我希望标准要求 meals 在每个编译单元中具有相同的值?)。

我发现很多初学者提出的问题,询问他们应该使用 strcmp 的情况,但我找不到可以回答这个特殊情况的问题。任何帮助将不胜感激,特别是如果您能指出 C 标准的正确部分,这样我就可以 真正地 确保我理解所有的细微之处。

我能想到几个 char * 平等有意义的例子:

  1. 你给出的案例:通过从同一个指针复制
  2. 对于大多数(所有?)编译器:在同一翻译单元中使用任何相同值的字符串文字。这是一个非常常见的优化,无论如何都可以轻松测试。
  3. 如果您通过 intern() 函数显式传递字符串
  4. 在执行昂贵的值检查之前作为快速短路比较

==!=比较两个相同类型的字符串总是合法的。这在 C standard 的第 6.5.9 节中有详细说明,其中详细介绍了相等运算符:

2 One of the following shall hold:

  • both operands have arithmetic type;
  • both operands are pointers to qualified or unqualified versions of compatible types;
  • one operand is a pointer to an object type and the other is a pointer to a qualified or unqualified version of void;or
  • one operand is a pointer and the other is a null pointer constant.

...

4 Two pointers compare equal if and only if both are null pointers, both are pointers to the same object (including a pointer to an object and a subobject at its beginning) or function, both are pointers to one past the last element of the same array object, or one is a pointer to one past the end of one array object and the other is a pointer to the start of a different array object that happens to immediately follow the first array object in the address space

在这种情况下,您有一个指针数组,并将其中一个指针的值分配给另一个数组。因此,如果您比较两个指针并且它们都包含(例如)meals[0] 的值,例如字符串常量的地址 "none",它们保证比较相等。

您需要注意的是,是否在多个地方使用了给定的字符串常量。在那种情况下,它们不一定相同。

例如,鉴于此:

const char *s1 = "test";
const char *s2 = "test";

不保证 s1s2 的值相同,因为这两个字符串常量可以彼此不同,尽管编译器可能会选择使它们相同。这不同于:

const char *s1 = "test";
const char *s2 = s1;

其中 s1s2 相同,这反映了您的情况。

正如您所提到的,hour_to_meal_map 包含数字常量(最好是 enum 的成员)并且这些常量随后映射到字符串数组会更有意义。但是指向字符串常量的指针实际上就是这样。