C语言再学习 -- 负数
有符号数的表示方法是由硬件决定,而不是由C决定的。有三种表示方法:
1、二进制原码
0000 0001 表示 1
1000 0001 表示 -1
这个方法有个缺点是有两个零:+0 和 -0。这会引起混淆,而且用两个位组合来表示一个值也有些浪费。
2、二进制补码(最普遍的系统)
区别在于 singned 和 unsigned:
1)如果是无符号字节, 1000 0000 该组合为 128
2)如果是有符号字节, 1000 0000 该组合为 -128
第一种表示数的范围是 0 ~ 255
第二种表示数的范围是 -128 ~ +127,对于一个二进制补码数取负数,最简单的方法就是取反、加 1
3、二进制反码
通过反转位组合中的每一位以形成一个数的负数,例如:
0000 0001 表示 1
1111 1110 表示 -1
这种方式也有一个 -0:1111 1111。其范围是 -127 ~ +127
下面重点介绍二进制补码:
计算机中的负数是以其补码形式存在的 补码=原码取反+1
一个字节有8位 可以表示的数值范围在 -128到+127
用二进制表示也就是 10000000 - 01111111(注意:最高位表示符号)
最高位是1的都是负数 最高位是0的都是正数
二进制数是逢二进一 只有0和1两个数字 没有2
如-7 原码是 10000111 然后取反(最高位是符合不用取反)得11111000
加一 得11111001 那么-7的二进制数就是 11111001
再如 -10 原码是 10001010 取反得 11110101 加一得 11110110
那么-10的二进制数就是 11110110
下面就考虑一下这个问题:
#include <stdio.h>
int main()
{
char a[1000];
int i;
for(i=0; i<1000; i++)
{
a[i] = -1-i;
}
printf("%d",strlen(a));
return 0;
}
输出结果:
255
按照负数补码的规则,可以知道-1的补码为0xff, -2的补码为0xfe……当 i 的值为 127时, a[127]的值为-128,而-128 是 char 类型数据能表示的最小的负数。当 i 继续增加, a[128]的值肯定不能是-129。因为这时候发生了溢出, -129 需要 9 位才能存储下来,而 char 类型数据只有 8 位,所以最高位被丢弃。剩下的 8 位是原来 9 位补码的低 8 位的值,即 0x7f。当 i 继续增加到 255 的时候, -256 的补码的低 8 位为 0。然后当 i 增加到 256 时, -257 的补码的低 8 位全为 1,即低八位的补码为 0xff,如此又开始一轮新的循环……
按照上面的分析, a[0]到 a[254]里面的值都不为 0,而 a[255]的值为 0。strlen 函数是计算字符串长度的,并不包含字符串最后的‘ \0’。而判断一个字符串是否结束的标志就是看是否遇到‘ \0’。如果遇到‘ \0’,则认为本字符串结束。
所以输出结果为 255
最后思考一个问题:-0 和+0 在内存里面分别怎么存储?
以char类型为例
对于正数原码、反码以及补码是其本身
+0
原码 00000000
反码 00000000
补码 00000000
负数的原码是其本身,反码是对原码除符号位之外的各位取反,补码则是反码加1
-0
原码 10000000
反码 11111111
补码 1 00000000
因为char类型只有8位,所以放弃最高位。由此可见,在计算机存储系统中+0 及 -0 的补码是一致的。即采用补码的方法,可以将+0 及 -0 统一表示,否则需要将+0 和-0 区别对待,增加运算复杂度。
上面是以char为例,换成short和int等,原理是一样的。可以亲自动手加深印象。