从较小的数据类型转换为较大的数据类型,反之亦然
Converting from smaller data type to bigger and vice versa
我有这个 C 代码试图在 signed char
中存储一个 signed short
。
signed char
范围是 [-128,127]
,signed short
范围是 [-32768, 32767]
。
signed char sChar = SCHAR_MAX;
printf("Signed Char: %d", sChar);
signed short sShort = SHRT_MAX;
printf("\nSigned Short: %d", sShort);
sChar = sShort;
printf("\nSigned Short to Signed Char: %d", sChar);
输出:
Signed Char: 127
Signed Short: 32767
Signed Short to Signed Char: -1
这是我认为在后台发生的事情。
signed short in bits: 0111 1111 1111 1111 (32767)
signed char in bits: <discarded bits> 1111 1111 (-1)
基本上它从右边复制所有位并丢弃剩余位。 TL;DR 它截断 short 以将其存储在 char 中,因此我们丢失了信息。
Question starts here. Information above was to give background.
假设我给 signed char
-1 并尝试将其存储在 signed short
中。 signed short
中的值将为 -1。
在二进制中,如果表示它将是:
signed char in bits: 1111 1111 (-1)
signed short in bits: 1111 1111 1111 1111 (32767)
我的问题是编译器是如何在后台将char赋值给short的?肯定不是像上面那样一对一的拷贝。我的猜测是它将位向右移动,而 ones' compliment 其余部分。
1111 1111 // Signed Char
1111 1111 0000 0000 // Shifting bits
1111 1111 1111 1111 // Ones' complimenting the right 8 bits
how does compiler assigns (signed) char to short in background?
抛开底层的位机制。 值 被复制。
从任何数字类型转换为另一种数字类型时都会发生这种情况。
当目标类型缺少值时,结果取决于类型。使用 signed 整数类型:"the new type is signed and the value cannot be represented in it; either the result is implementation-defined or an implementation-defined signal is raised" C11dr §6.3.1.3 3
如果您必须知道,符号位可能是 sign extended。
这不是一个完整而好的答案,因为我想睡觉,但我认为可能对你有所帮助。
我会尽快编辑。
代码
#include <stdio.h>
#include <limits.h>
#show bits
//
void printbitsc( signed char x)
{
for(int i=sizeof(x)<<3; i; i--)
putchar('0'+((x>>(i-1))&1));
}
void printbitss( signed short x)
{
for(int i=sizeof(x)<<3; i; i--)
putchar('0'+((x>>(i-1))&1));
}
//https://www.geeksforgeeks.org/little-and-big-endian-mystery/
/* function to show bytes in memory, from location start to start+n*/
void show_mem_rep(char *start, int n)
{
int i;
for (i = 0; i < n; i++)
printf(" %.2x", start[i]);
printf("\n");
if (start[0]==0x67)
printf("little endian\n");
else
printf("big endian\n");
}
int main(int argc, char const *argv[]) {
int i = 0x01234567;
show_mem_rep((char *)&i, sizeof(i));
printf("%zu\n",sizeof (signed short));
printf("%zu\n",sizeof (signed char));
signed char sChar = SCHAR_MAX;
printf("Signed Char: %d\n", sChar);
printbitsc(sChar);
signed short sShort = SHRT_MAX;
printf("\nSigned Short: %d\n", sShort);
printbitss(sShort);
sChar = sShort;
printf("\nSigned Short to Signed Char: %d\n", sChar);
printbitsc(sChar);
signed char ssChar = SCHAR_MAX;
printf("Signed Char: %d\n", ssChar);
printbitsc(ssChar);
signed short ssShort = SHRT_MAX;
printf("\nSigned Short: %d\n", ssShort);
printbitss(ssShort);
ssShort=ssChar;
printf("\nSigned Short to Signed Char: %d\n", ssShort);
printbitsc(ssShort);
return 0;
}
在内存中以相反顺序存储在小端数据中,即 0x01: 1
值存储在内存中:0x10:1111_0000:240
(改变一和零的顺序)
所以在第一种情况下,我们面临截断情况
ss: 0111_1111_1111_1111
7 F F F
内存中我们实际有:F F F 7
和
sc: 0111_1111
7 女
在内存中我们实际上有:F 7
现在通过分配 ss
内存的第一个元素,即 FF
将被截断并放置在 16 位 sc
位置。
F F -> F 7
现在我们实际上在内存中有:1111_1111
让我们将其转换为人类可读的数字(我将二进制补码转换为十进制)
首先拳一表示负(1:-)
现在我们通过跟踪转换算法达到 :111_1111
: minus [ not( 111_1111) + 1]
= minus[(000_0000)+1]
= minus [1] = -1
最后我们在 sc
变量上达到 -1
。
在第二种情况下,整数提升将累积。
sc: 0111_1111
7 女
内存:F 7
ss: 0111_1111_1111_1111
7 F F F
内存:F F F 7
我们使用内存 F7
想进入 FFF7
因此必须通过添加多余的 0 将 F7
提升为 16 位长度。
这些零添加在第一个元素之后,F7
更改为 F700
。
现在的问题是F700
如何去16位长度的地方。
F700 -> F F F 7
之后我们面对F700
一个16位长度的变量。
我们知道F700
实际上代表了这些位模式:0000_0000_0111_1111
当我们用正常 printf()
阅读它时,它显示 007F
.
通过简单的二进制到十进制的转换 007F
等于 127
.
待办事项
- 编辑 post 使其变得更好
我有这个 C 代码试图在 signed char
中存储一个 signed short
。
signed char
范围是 [-128,127]
,signed short
范围是 [-32768, 32767]
。
signed char sChar = SCHAR_MAX;
printf("Signed Char: %d", sChar);
signed short sShort = SHRT_MAX;
printf("\nSigned Short: %d", sShort);
sChar = sShort;
printf("\nSigned Short to Signed Char: %d", sChar);
输出:
Signed Char: 127
Signed Short: 32767
Signed Short to Signed Char: -1
这是我认为在后台发生的事情。
signed short in bits: 0111 1111 1111 1111 (32767)
signed char in bits: <discarded bits> 1111 1111 (-1)
基本上它从右边复制所有位并丢弃剩余位。 TL;DR 它截断 short 以将其存储在 char 中,因此我们丢失了信息。
Question starts here. Information above was to give background.
假设我给 signed char
-1 并尝试将其存储在 signed short
中。 signed short
中的值将为 -1。
在二进制中,如果表示它将是:
signed char in bits: 1111 1111 (-1)
signed short in bits: 1111 1111 1111 1111 (32767)
我的问题是编译器是如何在后台将char赋值给short的?肯定不是像上面那样一对一的拷贝。我的猜测是它将位向右移动,而 ones' compliment 其余部分。
1111 1111 // Signed Char
1111 1111 0000 0000 // Shifting bits
1111 1111 1111 1111 // Ones' complimenting the right 8 bits
how does compiler assigns (signed) char to short in background?
抛开底层的位机制。 值 被复制。
从任何数字类型转换为另一种数字类型时都会发生这种情况。
当目标类型缺少值时,结果取决于类型。使用 signed 整数类型:"the new type is signed and the value cannot be represented in it; either the result is implementation-defined or an implementation-defined signal is raised" C11dr §6.3.1.3 3
如果您必须知道,符号位可能是 sign extended。
这不是一个完整而好的答案,因为我想睡觉,但我认为可能对你有所帮助。
我会尽快编辑。
代码
#include <stdio.h>
#include <limits.h>
#show bits
//
void printbitsc( signed char x)
{
for(int i=sizeof(x)<<3; i; i--)
putchar('0'+((x>>(i-1))&1));
}
void printbitss( signed short x)
{
for(int i=sizeof(x)<<3; i; i--)
putchar('0'+((x>>(i-1))&1));
}
//https://www.geeksforgeeks.org/little-and-big-endian-mystery/
/* function to show bytes in memory, from location start to start+n*/
void show_mem_rep(char *start, int n)
{
int i;
for (i = 0; i < n; i++)
printf(" %.2x", start[i]);
printf("\n");
if (start[0]==0x67)
printf("little endian\n");
else
printf("big endian\n");
}
int main(int argc, char const *argv[]) {
int i = 0x01234567;
show_mem_rep((char *)&i, sizeof(i));
printf("%zu\n",sizeof (signed short));
printf("%zu\n",sizeof (signed char));
signed char sChar = SCHAR_MAX;
printf("Signed Char: %d\n", sChar);
printbitsc(sChar);
signed short sShort = SHRT_MAX;
printf("\nSigned Short: %d\n", sShort);
printbitss(sShort);
sChar = sShort;
printf("\nSigned Short to Signed Char: %d\n", sChar);
printbitsc(sChar);
signed char ssChar = SCHAR_MAX;
printf("Signed Char: %d\n", ssChar);
printbitsc(ssChar);
signed short ssShort = SHRT_MAX;
printf("\nSigned Short: %d\n", ssShort);
printbitss(ssShort);
ssShort=ssChar;
printf("\nSigned Short to Signed Char: %d\n", ssShort);
printbitsc(ssShort);
return 0;
}
在内存中以相反顺序存储在小端数据中,即 0x01: 1
值存储在内存中:0x10:1111_0000:240
(改变一和零的顺序)
所以在第一种情况下,我们面临截断情况
ss: 0111_1111_1111_1111
7 F F F
内存中我们实际有:F F F 7
和
sc: 0111_1111
7 女
在内存中我们实际上有:F 7
现在通过分配 ss
内存的第一个元素,即 FF
将被截断并放置在 16 位 sc
位置。
F F -> F 7
现在我们实际上在内存中有:1111_1111
让我们将其转换为人类可读的数字(我将二进制补码转换为十进制)
首先拳一表示负(1:-)
现在我们通过跟踪转换算法达到 :111_1111
: minus [ not( 111_1111) + 1]
= minus[(000_0000)+1]
= minus [1] = -1
最后我们在 sc
变量上达到 -1
。
在第二种情况下,整数提升将累积。
sc: 0111_1111
7 女
内存:F 7
ss: 0111_1111_1111_1111
7 F F F
内存:F F F 7
我们使用内存 F7
想进入 FFF7
因此必须通过添加多余的 0 将 F7
提升为 16 位长度。
这些零添加在第一个元素之后,F7
更改为 F700
。
现在的问题是F700
如何去16位长度的地方。
F700 -> F F F 7
之后我们面对F700
一个16位长度的变量。
我们知道F700
实际上代表了这些位模式:0000_0000_0111_1111
当我们用正常 printf()
阅读它时,它显示 007F
.
通过简单的二进制到十进制的转换 007F
等于 127
.
待办事项
- 编辑 post 使其变得更好