使用 unsigned int 而不是 unsigned short 改变行为
Using unsigned int instead of unsigned short changes behaviour
我正在尝试使用 K&R 的 The C Programming Language 中的 htoi(char*)
函数(练习 2-3,第 43 页)。
该函数用于将十六进制字符串转换为以 10 为基数的字符串。
我相信我已经成功了。这是我的代码:
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <math.h>
enum {hexbase = 16};
typedef enum{false, true} bool;
unsigned int htoi(char* s);
bool hasHexPrefix(char* s);
int main(int argc, char** argv) {
if(argc <= 1) {
printf("Error: Not enough arguments.\n");
return EXIT_FAILURE;
}else {
for(int i = 1; i < argc; i++) {
unsigned int numericVal = htoi(argv[i]);
printf("%s => %u\n",argv[i],numericVal);
}
}
}
unsigned int htoi(char* s) {
unsigned int output = 0;
unsigned int len = (unsigned int)(strlen(s));
unsigned short int firstIndex = hasHexPrefix(s) ? 2 : 0;
/* start from the end of the str (least significant digit) and move to front */
for(int i = len-1; i >= firstIndex; i--) {
int currentChar = s[i];
unsigned int correspondingNumericVal = 0;
if(currentChar >= '0' && currentChar <= '9') {
correspondingNumericVal = currentChar - '0';
}else if(currentChar >= 'a' && currentChar <= 'f') {
correspondingNumericVal = (currentChar - 'a') + 10;
}else if(currentChar >= 'A' && currentChar <= 'F') {
correspondingNumericVal = (currentChar - 'A') + 10;
}else {
printf("Error. Invalid hex digit: %c.\n",currentChar);
}
/* 16^(digitNumber) */
correspondingNumericVal *= pow(hexbase,(len-1)-i);
output += correspondingNumericVal;
}
return output;
}
bool hasHexPrefix(char* s) {
if(s[0] == '0')
if(s[1] == 'x' || s[1] == 'X')
return true;
return false;
}
我的问题与 htoi(char*)
函数中的以下行有关:
unsigned short int firstIndex = hasHexPrefix(s) ? 2 : 0;
当我删除 short
使 firstIndex
变成 unsigned int
而不是 unsigned short int
时,我得到了一个无限循环。
所以当我从 htoi(char* s)
中 s
的后面开始时,i >= firstIndex
永远不会计算为假。
为什么会这样?我是否遗漏了一些微不足道的东西,或者我是否做了一些非常错误的事情导致了这种未定义的行为?
当firstIndex
为unsigned int
时,在i >= firstIndex
中,由于通常的算术转换,i
被转换为unsigned int
。所以如果 i
是负数,它在比较表达式中变成一个大整数。当 firstIndex
在 i >= firstIndex
中是 unsigned short int
时, firstIndex
被提升为 int
并且比较两个有符号整数。
您可以更改:
for(int i = len-1; i >= firstIndex; i--)
到
for(int i = len-1; i >= (int) firstIndex; i--)
在两种情况下具有相同的行为。
我正在尝试使用 K&R 的 The C Programming Language 中的 htoi(char*)
函数(练习 2-3,第 43 页)。
该函数用于将十六进制字符串转换为以 10 为基数的字符串。
我相信我已经成功了。这是我的代码:
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <math.h>
enum {hexbase = 16};
typedef enum{false, true} bool;
unsigned int htoi(char* s);
bool hasHexPrefix(char* s);
int main(int argc, char** argv) {
if(argc <= 1) {
printf("Error: Not enough arguments.\n");
return EXIT_FAILURE;
}else {
for(int i = 1; i < argc; i++) {
unsigned int numericVal = htoi(argv[i]);
printf("%s => %u\n",argv[i],numericVal);
}
}
}
unsigned int htoi(char* s) {
unsigned int output = 0;
unsigned int len = (unsigned int)(strlen(s));
unsigned short int firstIndex = hasHexPrefix(s) ? 2 : 0;
/* start from the end of the str (least significant digit) and move to front */
for(int i = len-1; i >= firstIndex; i--) {
int currentChar = s[i];
unsigned int correspondingNumericVal = 0;
if(currentChar >= '0' && currentChar <= '9') {
correspondingNumericVal = currentChar - '0';
}else if(currentChar >= 'a' && currentChar <= 'f') {
correspondingNumericVal = (currentChar - 'a') + 10;
}else if(currentChar >= 'A' && currentChar <= 'F') {
correspondingNumericVal = (currentChar - 'A') + 10;
}else {
printf("Error. Invalid hex digit: %c.\n",currentChar);
}
/* 16^(digitNumber) */
correspondingNumericVal *= pow(hexbase,(len-1)-i);
output += correspondingNumericVal;
}
return output;
}
bool hasHexPrefix(char* s) {
if(s[0] == '0')
if(s[1] == 'x' || s[1] == 'X')
return true;
return false;
}
我的问题与 htoi(char*)
函数中的以下行有关:
unsigned short int firstIndex = hasHexPrefix(s) ? 2 : 0;
当我删除 short
使 firstIndex
变成 unsigned int
而不是 unsigned short int
时,我得到了一个无限循环。
所以当我从 htoi(char* s)
中 s
的后面开始时,i >= firstIndex
永远不会计算为假。
为什么会这样?我是否遗漏了一些微不足道的东西,或者我是否做了一些非常错误的事情导致了这种未定义的行为?
当firstIndex
为unsigned int
时,在i >= firstIndex
中,由于通常的算术转换,i
被转换为unsigned int
。所以如果 i
是负数,它在比较表达式中变成一个大整数。当 firstIndex
在 i >= firstIndex
中是 unsigned short int
时, firstIndex
被提升为 int
并且比较两个有符号整数。
您可以更改:
for(int i = len-1; i >= firstIndex; i--)
到
for(int i = len-1; i >= (int) firstIndex; i--)
在两种情况下具有相同的行为。