计算机中的原码、反码和补码

来源:互联网 发布:乐股软件免费版 编辑:程序博客网 时间:2024/04/29 19:34

看到这个标题,很多人有话要说了,切!这个东西每一本计算机基础知识的书中都有介绍的,你还拿出来Show什么嘛!我的原则是你需要就来看一看,懂就不要去理会,倒也不必讽刺两句,我相信总有需要它的人。当初我看书是没看明白的,在网上查了好多资料才有所悟。

  前几天跟老婆讲原码、反码和补码的知识,老婆似懂非懂,在这里我发表一下我个人的意见,浅显的把我所理解的原码、反码和补码的知识总结一下,一来可以给不懂的人来点启示,二来也可以方便老婆以后记忆复习。理解有不对的地方希望大家予以指出,谢谢!

  大家都知道数据在计算机中都是按字节来储存了,1个字节等于8位(1Byte=8bit),而计算机只能识别0和1这两个数,所以根据排列,1个字节能代表256种不同的信息,即28(0和1两种可能,8位排列),比如定义一个字节大小的无符号整数(unsigned char),那么它能表示的是0~255(0~28-1)这些数,一共是256个数,因为,前面说了,一个字节只能表示256种不同的信息。别停下,还是一个字节的无符号整数,我们来进一步剖析它,0是这些数中最小的一个,我们先假设它在计算机内部就用8位二进制表示为00000000(从理论上来说也可以表示成其他不同的二进制码,只要这256个数每个数对应的二进制码都不相同就可以了),再假设1表示为00000001,2表示为00000010,3表示为00000011,依次类推,那么最大的那个数255在8位二进制中就表示为最大的数11111111,然后,我们把这些二进制码换算成十进制看看,会发现刚好和我们假设的数是相同的,而事实上,在计算机中,无符号的整数就是按这个原理来储存的,所以告诉你一个无符号的整数的二进制码,你就可以知道这个数是多少,而且知道在计算机中,这个数本身就是以这个二进制码来储存的。比如我给你一个2个字节大小的二进制码,首先声明它表示的是无符号的整数:00000000 00000010,我们把前面的0省略,换算一下,它表示的也是数值2,和前面不同的是,它占了2个字节的内存。不同的类型占的内存空间不同,如在我的电脑中char是1个字节,int是4个字节,long是8个字节(你的可能不同,这取决于不同的计算机设置),它们的不同之处仅仅是内存大的能表示的不同的信息多些,也就是能表示的数范围更大些(unsigned int能表示的范围是0~28*4-1),至于怎么算,其实都是一样的,直接把二进制与十进制相互转换,二进制就是它在计算机中的样子,十进制就是我们所表示的数。啊哈,原来这些都是可以计算的呀,我曾经还以为不同的计算机储存的原理是不同的,取决于商家的喜好呢,呵呵。说了这么多怎么还没有提到原码、反码和补码呀,别急别急,心急吃不了热豆腐,呵呵,因为无符号的整数根本就没有原码、反码和补码。(啊,那不是被欺骗了,5555````我告诉妈妈去,哥哥欺负我)都说了别急嘛,你就不想想我说了这么半天的无符号整数,那么有符号的整数怎么办啊?

  呵呵,对,只有有符号的整数才有原码、反码和补码的!其他的类型一概没有。虽然我们也可以用二进制中最小的数去对应最小的负数,最大的也相对应,但是那样不科学,下面来说说科学的方法。还是说一个字节的整数,不过这次是有符号的啦,1个字节它不管怎么样还是只能表示256个数,因为有符号所以我们就把它表示成范围:-128-127。它在计算机中是怎么储存的呢?可以这样理解,用最高位表示符号位,如果是0表示正数,如果是1表示负数,剩下的7位用来储存数的绝对值的话,能表示27个数的绝对值,再考虑正负两种情况,27*2还是256个数。首先定义0在计算机中储存为00000000,对于正数我们依然可以像无符号数那样换算,从00000001到01111111依次表示1到127。那么这些数对应的二进制码就是这些数的原码。到这里很多人就会想,那负数是不是从10000001到11111111依次表示-1到-127,那你发现没有,如果这样的话那么一共就只有255个数了,因为10000000的情况没有考虑在内。实际上,10000000在计算机中表示最小的负整数,就是这里的-128,而且实际上并不是从10000001到11111111依次表示-1到-127,而是刚好相反的,从10000001到11111111依次表示-127到-1。负整数在计算机中是以补码形式储存的,补码是怎么样表示的呢,这里还要引入另一个概念——反码,所谓反码就是把负数的原码除符号位(负数的原码除符号位和它的绝对值所对应的原码相同,简单的说就是绝对值相同的数原码相同)各个位按位取反,是1就换成0,是0就换成1,如-1的原码是0000001(注意这里只有7位,不看符号位,我这里所说的负数符号位都是1),和1的原码相同,那么-1的反码就是1111110(这也是7位,后面加上了符号位都是8位了),而补码就是在反码的基础上加1,即-1的补码是11111110+1=11111111,因此我们可以算出-1在计算机中是按11111111储存的。总结一下,计算机储存有符号的整数时,是用该整数的补码进行储存的,0的原码、补码都是0,正数的原码、补码可以特殊理解为相同,负数的补码是它的反码加1。
--------------------------------------------------------------------------
文章作者并没有解释为什么负数采用补码,补码为什么是通过对应正数求反码然后加1得到,这其中有什么数学理论依据。
以下通过直观的例子说明,这里为方便采用单字节说明:

0                                      127                                      255
|_____________________|______________________|

-128                                  0                                          127
|_____________________|______________________|


从图中可以看到,我们可以让

-128跟0用同一个二进制

-127跟1用同一个二进制

-126跟2用同一个二进制

……

只不过,二进制的最高位要设置为1,以表示这是个负数,即

-128                  0

1000 0000       0000 0000

-127                  1

1000 0001       0000 0001

-126                  2

1000 0010      0000 0010

……

接下来注意到

1000 0000 可以按以下步骤得到:

1000 0000-取反->0111 1111

0111 1111-加1->10000000

即 128取反然后加1

1000 0001可以按以下步骤得到:

0111 1111-取反->1000 0000

1000 0000-加1->10000001

即127取反然后加1

1000 0010可以按以下步骤得到:

0111 1110-取反->1000 0001

1000 0001-加1->1000 0010

即126取反然后加1

…….

因此,负数就可以用它的正数取反然后加1来表示,这最终的结果称为正数的补码。


==============================================

权威的关于原码、反码、补码的来源和说明,查看https://en.wikipedia.org/wiki/Signed_number_representations#Ones.27_complement

简单讲,历史上,原码、反码都曾被用过(好像那时电路制作工艺还不高,做不出补码电路),但是它们都解决不了衍生出的+0和-0的问题,直到后来补码电路设计出后,补码表示法开始大量被应用,且它解决了+0和-0的问题。