什么时候可以通过 char * 相等来比较 C 字符串?
When is it okay to compare C strings by char * equality?
我知道比较两个任意的 c 字符串 (const char *
) 是没有意义的 (a == b)
。
但我认为当两者都由相同的字符串文字定义时,这是合法的。
例如,这里:
#include <stddef.h>
const char * const meals[] = {
"none",
"breakfast",
"lunch",
"dinner"
};
#define NO_MEALS meals[0]
#define BREAKFAST meals[1]
#define LUNCH meals[2]
#define DINNER meals[3]
// i hours after midnight, hour_to_meals_map[floor(i)] is being served.
const char * hour_to_meal_map[] = {
NO_MEALS,
NO_MEALS,
NO_MEALS,
NO_MEALS,
NO_MEALS,
BREAKFAST, // i = 5
BREAKFAST,
BREAKFAST,
BREAKFAST,
BREAKFAST,
BREAKFAST,
LUNCH, // i = 11
LUNCH,
LUNCH,
LUNCH,
LUNCH,
LUNCH,
DINNER, // i = 17
DINNER,
DINNER,
DINNER,
DINNER,
DINNER,
DINNER // i = 23
};
// Returns a boolean for whether the two hours have the same meal being eaten.
int same_meal(size_t hour_one, size_t hour_two) {
return hour_to_meal_map[hour_one] == hour_to_meal_map[hour_two];
}
(至于为什么你会让 hour_to_meal_map
映射到字符串而不是索引是任何人的猜测......但我正在做一个以这种方式设置的项目。)
我是否正确认为这在这里是合法的,重要的是每个值只有一个地方是按文字写的? (#define NO_MEALS "none"
是故意回避的!!)
如果此代码在头文件中,那没有什么区别,不是吗? (我希望标准要求 meals
在每个编译单元中具有相同的值?)。
我发现很多初学者提出的问题,询问他们应该使用 strcmp
的情况,但我找不到可以回答这个特殊情况的问题。任何帮助将不胜感激,特别是如果您能指出 C 标准的正确部分,这样我就可以 真正地 确保我理解所有的细微之处。
我能想到几个 char *
平等有意义的例子:
- 你给出的案例:通过从同一个指针复制
- 对于大多数(所有?)编译器:在同一翻译单元中使用任何相同值的字符串文字。这是一个非常常见的优化,无论如何都可以轻松测试。
- 如果您通过
intern()
函数显式传递字符串
- 在执行昂贵的值检查之前作为快速短路比较
用==
或!=
比较两个相同类型的字符串总是合法的。这在 C standard 的第 6.5.9 节中有详细说明,其中详细介绍了相等运算符:
2 One of the following shall hold:
- both operands have arithmetic type;
- both operands are pointers to qualified or unqualified versions of compatible types;
- one operand is a pointer to an object type and the other is a pointer to a qualified or unqualified version of
void
;or
- one operand is a pointer and the other is a null pointer constant.
...
4 Two pointers compare equal if and only if both are null pointers, both are pointers to the same object (including a pointer to an object
and a subobject at its beginning) or function, both are pointers to
one past the last element of the same array object, or one is a
pointer to one past the end of one array object and the other is a
pointer to the start of a different array object that happens to
immediately follow the first array object in the address space
在这种情况下,您有一个指针数组,并将其中一个指针的值分配给另一个数组。因此,如果您比较两个指针并且它们都包含(例如)meals[0]
的值,例如字符串常量的地址 "none",它们保证比较相等。
您需要注意的是,是否在多个地方使用了给定的字符串常量。在那种情况下,它们不一定相同。
例如,鉴于此:
const char *s1 = "test";
const char *s2 = "test";
不保证 s1
和 s2
的值相同,因为这两个字符串常量可以彼此不同,尽管编译器可能会选择使它们相同。这不同于:
const char *s1 = "test";
const char *s2 = s1;
其中 s1
和 s2
将 相同,这反映了您的情况。
正如您所提到的,hour_to_meal_map
包含数字常量(最好是 enum
的成员)并且这些常量随后映射到字符串数组会更有意义。但是指向字符串常量的指针实际上就是这样。
我知道比较两个任意的 c 字符串 (const char *
) 是没有意义的 (a == b)
。
但我认为当两者都由相同的字符串文字定义时,这是合法的。
例如,这里:
#include <stddef.h>
const char * const meals[] = {
"none",
"breakfast",
"lunch",
"dinner"
};
#define NO_MEALS meals[0]
#define BREAKFAST meals[1]
#define LUNCH meals[2]
#define DINNER meals[3]
// i hours after midnight, hour_to_meals_map[floor(i)] is being served.
const char * hour_to_meal_map[] = {
NO_MEALS,
NO_MEALS,
NO_MEALS,
NO_MEALS,
NO_MEALS,
BREAKFAST, // i = 5
BREAKFAST,
BREAKFAST,
BREAKFAST,
BREAKFAST,
BREAKFAST,
LUNCH, // i = 11
LUNCH,
LUNCH,
LUNCH,
LUNCH,
LUNCH,
DINNER, // i = 17
DINNER,
DINNER,
DINNER,
DINNER,
DINNER,
DINNER // i = 23
};
// Returns a boolean for whether the two hours have the same meal being eaten.
int same_meal(size_t hour_one, size_t hour_two) {
return hour_to_meal_map[hour_one] == hour_to_meal_map[hour_two];
}
(至于为什么你会让 hour_to_meal_map
映射到字符串而不是索引是任何人的猜测......但我正在做一个以这种方式设置的项目。)
我是否正确认为这在这里是合法的,重要的是每个值只有一个地方是按文字写的? (#define NO_MEALS "none"
是故意回避的!!)
如果此代码在头文件中,那没有什么区别,不是吗? (我希望标准要求 meals
在每个编译单元中具有相同的值?)。
我发现很多初学者提出的问题,询问他们应该使用 strcmp
的情况,但我找不到可以回答这个特殊情况的问题。任何帮助将不胜感激,特别是如果您能指出 C 标准的正确部分,这样我就可以 真正地 确保我理解所有的细微之处。
我能想到几个 char *
平等有意义的例子:
- 你给出的案例:通过从同一个指针复制
- 对于大多数(所有?)编译器:在同一翻译单元中使用任何相同值的字符串文字。这是一个非常常见的优化,无论如何都可以轻松测试。
- 如果您通过
intern()
函数显式传递字符串 - 在执行昂贵的值检查之前作为快速短路比较
用==
或!=
比较两个相同类型的字符串总是合法的。这在 C standard 的第 6.5.9 节中有详细说明,其中详细介绍了相等运算符:
2 One of the following shall hold:
- both operands have arithmetic type;
- both operands are pointers to qualified or unqualified versions of compatible types;
- one operand is a pointer to an object type and the other is a pointer to a qualified or unqualified version of
void
;or- one operand is a pointer and the other is a null pointer constant.
...
4 Two pointers compare equal if and only if both are null pointers, both are pointers to the same object (including a pointer to an object and a subobject at its beginning) or function, both are pointers to one past the last element of the same array object, or one is a pointer to one past the end of one array object and the other is a pointer to the start of a different array object that happens to immediately follow the first array object in the address space
在这种情况下,您有一个指针数组,并将其中一个指针的值分配给另一个数组。因此,如果您比较两个指针并且它们都包含(例如)meals[0]
的值,例如字符串常量的地址 "none",它们保证比较相等。
您需要注意的是,是否在多个地方使用了给定的字符串常量。在那种情况下,它们不一定相同。
例如,鉴于此:
const char *s1 = "test";
const char *s2 = "test";
不保证 s1
和 s2
的值相同,因为这两个字符串常量可以彼此不同,尽管编译器可能会选择使它们相同。这不同于:
const char *s1 = "test";
const char *s2 = s1;
其中 s1
和 s2
将 相同,这反映了您的情况。
正如您所提到的,hour_to_meal_map
包含数字常量(最好是 enum
的成员)并且这些常量随后映射到字符串数组会更有意义。但是指向字符串常量的指针实际上就是这样。