C 按位或意外更改值

C Bitwise OR changing value unexpectedly

我目前正在编写一个涉及二进制内存的程序,我需要一个unsigned long long int中的某个位序列。

现在,我正在循环执行此代码块 4 次以尝试创建 32 位序列。

unsigned long long int currentEntry = 0;
for (int j = 0; j < 4; ++j){
    currentEntry = (currentEntry << 8);
    currentEntry = (currentEntry | (unsigned long long int)entryBuffer[i][j]);
}

entrybuffer[i][j] 是一个 char,它包含一个字节值,我将其转换为一个 unsigned long long int,据我所知它似乎在工作,直到我遇到一个奇怪的错误。 例如,这是二进制形式的 currentEntry 变量:

//goal bit sequence: 00001000000001001010000011000000

currentEntry = (currentEntry << 8); 
//00000000
currentEntry = (currentEntry | (unsigned long long int)entryBuffer[i][j]); //entrybuffer[i][j] = 00001000
//00001000
currentEntry = (currentEntry << 8); 
//0000100000000000
currentEntry = (currentEntry | (unsigned long long int)entryBuffer[i][j]); //entrybuffer[i][j] = 00000100
//0000100000000100
currentEntry = (currentEntry << 8); 
//000010000000010000000000
currentEntry = (currentEntry | (unsigned long long int)entryBuffer[i][j]); //entrybuffer[i][j] = 10100000
//111111111111111110100000    (what?)*****
currentEntry = (currentEntry << 8);
//11111111111111111010000000000000
currentEntry = (currentEntry | (unsigned long long int)entryBuffer[i][j]); //entrybuffer[i][j] = 11000000
//11111111111111111111111111000000

我似乎在这里遗漏了一些明显的东西,我想知道是否有人可以帮助我解决这个问题。我希望代码足够有意义。

很明显,按位或正在改变某些东西,或者某些东西在某处溢出,这就是为什么我将 currentEntry 设为无符号长整型。我显然只需要 4 个字节的存储空间,而且我知道这因机器而异,但是我认为一个 unsigned long long int 就足以满足我的目的。 如果需要更多信息和上下文,请告诉我。

谢谢!

类型 char 可以是 unsigned signed,具体取决于编译器。在您的情况下,它似乎是 signed.

这意味着当您将其转换为更大的类型时,您会遇到一种叫做 符号扩展 的东西。你在二进制数中看到的所有这些都是因为这个以及 two's complement(处理负数的最常见方法)是如何工作的。

如果要存储无符号的小 8 位值,请改用显式 uint8_t 类型(注意 u 前缀,代表 unsigned)。参见例如this fixed-width integer reference 获取更多信息。