计算机中的原码、反码、补码(上)

来源:互联网 发布:仿斗鱼直播源码 编辑:程序博客网 时间:2024/05/17 02:22



正数    :原码、反码、补码是一样的

负数:反码 = 除去符号位 按位取反

           补码 = 反码加1

计算机里存储的是补码

注:

      要注意溢出情况

   列如: char   i;

           它所能存储的范围是-128  ----- +127    总共是256个数

           原本是-127 --- -0   和  +0 --- +127

          +0    原码 0000 0000

                   反码0000 0000

                   补码0000 0000

           -0     原码1000 0000

                    反码1111 1111

                    补码10000 0000    1溢出舍去    -----0000 0000

           所以+0 -0 在计算机中补码是一样的,反码之间相距0 — -127  共128个数

            因为计算机反码对于-0 +0 有所区分,所以引入补码人们通常把-128 作为 -0

负数在计算机中如何表示?

举例来说,+8在计算机中表示为二进制的1000,那么-8怎么表示呢?

很容易想到,可以将一个二进制位(bit)专门规定为符号位,它等于0时就表示正数,等于1时就表示负数。比如,在8位机中,规定每个字节的最高位为符号位。那么,+8就是00001000,而-8则是10001000。

但是,随便找一本《计算机原理》,都会告诉你,实际上,计算机内部采用补码(Two's Complement)表示负数。

什么是补码?

它是一种数值的转换方法,要分二步完成:

第一步,每一个二进制位都取相反值,0变成1,1变成0。比如,00001000的相反值就是11110111。

第二步,将上一步得到的值加1。11110111就变成11111000。

所以,00001000的补码就是11111000。也就是说,-8在计算机(8位机)中就是用11111000表示。

不知道你怎么看,反正我觉得很奇怪,为什么要采用这么麻烦的方式表示负数,更直觉的方式难道不好吗?

昨天,我在一本书里又看到了这个问题,然后就花了一点时间到网上找资料,现在总算彻底搞明白了。

补码的好处

首先,要明确一点。计算机内部用什么方式表示负数,其实是无所谓的。只要能够保持一一对应的关系,就可以用任意方式表示负数。所以,既然可以任意选择,那么理应选择一种最方便的方式。

补码就是最方便的方式。它的便利体现在,所有的加法运算可以使用同一种电路完成。

还是以-8作为例子。

假定有两种表示方法。一种是直觉表示法,即10001000;另一种是补码表示法,即11111000。请问哪一种表示法在加法运算中更方便?

随便写一个计算式,16 + (-8) = ?

16的二进制表示是 00010000,所以用直觉表示法,加法就要写成:

 00010000
+10001000
---------
 10011000

可以看到,如果按照正常的加法规则,就会得到10011000的结果,转成十进制就是-24。显然,这是错误的答案。也就是说,在这种情况下,正常的加法规则不适用于正数与负数的加法,因此必须制定两套运算规则,一套用于正数加正数,还有一套用于正数加负数。从电路上说,就是必须为加法运算做两种电路。

现在,再来看补码表示法。

 00010000
+11111000
---------
100001000

可以看到,按照正常的加法规则,得到的结果是100001000。注意,这是一个9位的二进制数。我们已经假定这是一台8位机,因此最高的第9位是一个溢出位,会被自动舍去。所以,结果就变成了00001000,转成十进制正好是8,也就是16 + (-8) 的正确答案。这说明了,补码表示法可以将加法运算规则,扩展到整个整数集,从而用一套电路就可以实现全部整数的加法。

补码的本质

在回答补码为什么能正确实现加法运算之前,我们先看看它的本质,也就是那两个步骤的转换方法是怎么来的。

要将正数转成对应的负数,其实只要用0减去这个数就可以了。比如,-8其实就是0-8。

已知8的二进制是00001000,-8就可以用下面的式子求出:

 00000000
-00001000
---------

因为00000000(被减数)小于0000100(减数),所以不够减。请回忆一下小学算术,如果被减数的某一位小于减数,我们怎么办?很简单,问上一位借1就可以了。

所以,0000000也问上一位借了1,也就是说,被减数其实是100000000,算式也就改写成:

100000000
-00001000
---------
 11111000

进一步观察,可以发现100000000 = 11111111 + 1,所以上面的式子可以拆成两个:

 11111111
-00001000
---------
 11110111
+00000001
---------
 11111000

补码的两个转换步骤就是这么来的。

为什么正数加法适用于补码?

实际上,我们要证明的是,X-Y或X+(-Y)可以用X加上Y的补码完成。

Y的补码等于(11111111-Y)+1。所以,X加上Y的补码,就等于:

X + (11111111-Y) + 1

我们假定这个算式的结果等于Z,即 Z = X + (11111111-Y) + 1

接下来,分成两种情况讨论。

第一种情况,如果X小于Y,那么Z是一个负数。这时,我们就对Z采用补码的逆运算,求出它对应的正数绝对值,再在前面加上负号就行了。所以,

Z = -[11111111-(Z-1)] = -[11111111-(X + (11111111-Y) + 1-1)] = X - Y

第二种情况,如果X大于Y,这意味着Z肯定大于11111111,但是我们规定了这是8位机,最高的第9位是溢出位,必须被舍去,这相当于减去100000000。所以,

Z = Z - 100000000 = X + (11111111-Y) + 1 - 100000000 = X - Y

这就证明了,在正常的加法规则下,可以利用补码得到正数与负数相加的正确结果。换言之,计算机只要部署加法电路和补码电路,就可以完成所有整数的加法。

(完)

 

Z = X + (11111111-Y) + 1式子可以写为Z = X - Y +100000000,这在硬件上可以理解为两部分电路来实现,第一部分是前面的X - Y(这里姑且不管计算的结果是正还是负),第二部分是X - Y计算的结果再和100000000相加,最终得到计算的结果Z, 而在8位的计算机上100000000是不能出现的,其实这时100000000就相当于00000000(舍去了最高位),然后我们再看一些计算的过程:
Z = X + (11111111 - Y) + 1
= X - Y + 100000000
= X - Y + 00000000
= X - Y
证毕。
这样我们就证明了X-Y或X+(-Y)可以用X加上Y的2的补码完成,而不必分两种情况来证明。





如-1的原码是10000001,和1的原码在数值位上相同,那么 -1的反码就是11111110,

而补码就是在反码的基础上加1,即-1的补码是11111110+1=11111111,因此我们可以

算出-1在计算机 中是按11111111储存的。总结一下,计算机储存有符号的整数时,是

用其补码进行储存的,0的原码、补码都是0,正数的原码、补码可以特殊理解为相同,




负数的补码是它的反码加1。下面再多举几个例子,来帮助大家理解!

十进制 → 二进制  (怎么算?要是不知道看计算机基础的书去)


47   → 101111



有符号的整数    原码    反码    补码


  47      00101111  00101111  00101111(正数不区分原码、反码和

补码)


 -47      10101111  11010000  11010001(负数补码是在反码上加1)


再举个例子,学C语言的同学应该做过这道题:


把-1以无符号的类型输出,得什么结果?(程序如下)

#include<iostream.h>


void main()


{


 short int n=-1;


 cout<<(unsigned short int)n<<endl;


}

  首先在我的电脑中short int类型的储存空间是2个字节,你的可能不同,我说过,这

取决于你的计算机配置。它能储存28*2=65536个不同的数据信息,如果是无符号那么它




的范围是0~65535(0~216-1),如果是有符号,那么它的范围是-32768~32767(-215~


215-1)。 这道题目中,开始n是一个有符号的短整型变量,我们给它赋值为-1,根据我


们前面所说的,它在计算机中是以补码11111111 11111111储存的,注意前面说了是2


个字节。如果把它强制为无符号的短整型输出的话,那么我们就把刚才的二进制把看成


无符号的整型在计算机中储存的 形式,对待无符号的整型就没有什么原码、反码和补码



的概念了,直接把11111111 11111111转化成十进制就是65535,其实我们一看都是一


就知道它是范围中最大的一个数了。呵呵,就这么简单。你个把上面的源代码编译运行


看看, 如果你的电脑short int也是两个字节,那就会和我得一样的结果。你可以先用这


个语句看看:cout<<sizeof(short int)<<endl;看看你的电脑里的短整型占多少的储存空

间,也可以用sizeof来看其它任何类型所分配的储存空间。



  最后提醒一句,关于数据如何在计算机中储存的,这里只适用于整型的数据,对于

浮点型的是另一种方式,这里我们暂时就不深究了。


 补码的计算和引进补码的原因:

数值有正负之分,计算机就用一个数的最高位存放符号(0为正,1为负).


这就是机器数的原码了.假设机器能处理的位数为8.即字长为1byte,


原码能表示数值的范围为(-127~-0 +0~127)共256个.


有了数值的表示方法就可以对数进行算术运算.


但是很快就发现用带符号位的原码进行乘除运算时结果正确,


而在加减运算的时候就出现了问题,如下: 假设字长为8bits

( 1 ) 10-  ( 1 )10 =  ( 1 )10 + ( -1 )10 =  ( 0 )10

(00000001)原 + (10000001)原 = (10000010)原 = ( -2 ) 显然不正确.

因为在两个整数的加法运算中是没有问题的,于是就发现问题出现在带符号位的负数身上,
对除符号位外的其余各位逐位取反就产生了反码.反码的取值空间和原码相同且一一对应. 
下面是反码的减法运算:

( 1 )10 -  ( 1 ) 10=  ( 1 ) 10+ ( -1 ) 10=  ( 0 )10

(00000001) 反+ (11111110)反 =  (11111111)反 =  ( -0 )  有问题.

( 1 )10 -  ( 2)10 =  ( 1 )10 + ( -2 )10 =  ( -1 )10

(00000001) 反+ (11111101)反 =  (11111110)反 =  ( -1 ) 正确

问题出现在(+0)和(-0)上,在人们的计算概念中零是没有正负之分的.




于是就引入了补码概念. 负数的补码就是对反码加一,而正数不变,正数的原码反码补码是

一样的.

在补码中用(-128)代替了(-0),所以补码的表示范围为:(-128~0~127)共256个.已知某数的


补码,


先求某数的反码,然后在对反码+1,就得到某数的原码.比如:



已知某个数的补码是:10100110


先对10100110求反,得:11011001


再对11011001加1,得: 11011010


那么这个数为-86

原码表示的范围为:-(2^(n-1)-1)~+(2^(n-1)-1),


反码表示的范围为与原码一样.


补码表示的范围为:-2^(n-1)~+(2^(n-1)-1),


其中n为机器字长。

注意:

0的补码是唯一的,为0000,0000    [+0]补=[-0]补=0000,0000    -0的反码为1111,1111


8bit表示数值时(-128)没有相对应的原码和反码, (-128) = (10000000)  

补码的加减运算如下:


( 1 ) 10-  ( 1 ) 10=  ( 1 )10 + ( -1 )10 =  ( 0 )10


(00000001)补 + (11111111)补 =  (00000000)补 = ( 0 ) 正确

( 1 ) 10-  ( 2) 10=  ( 1 )10 + ( -2 )10 =  ( -1 )10

(00000001) 补+ (11111110) 补=  (11111111)补 = ( -1 )  正确

所以补码的设计目的是:

⑴使符号位能与有效值部分一起参加运算,从而简化计算机的运算规则.

⑵使减法运算转换为加法运算,进一步简化计算机中运算器的线路设计

所有这些转换都是在计算机的最底层进行的,而在我们使用的汇编、C等其他高级语言

中使用的都是原码。


看了上面这些大家应该对原码、反码、补码的知识印象更深了吧!!

个人总结:

负数的原码与其对应正数的原码除符号位(最高位)相反外(负数的符号位为1,正数

的符号位为0),其余数值位是相同的

可以这样认为,正数只有原码,其原码就是其二进制表示,正数在计算机中即是以其原

码形式存储的,负数有原码和补码,负数在计算机中是以其补码形式存储的

补码=原码的反码+1

 

原码表示的范围为:-(2^(n-1)-1)~+(2^(n-1)-1),


反码表示的范围为与原码一样.


补码表示的范围为:-2^(n-1)~+(2^(n-1)-1),


其中n为机器字长。

注意:


0的补码是唯一的,为0000,0000    [+0]补=[-0]补=0000,0000    -0的反码为1111,1111


8bit表示数值时(-128)没有相对应的原码和反码, (-128) = (1000 0000)  


对应的-2的8n-1次方都没有对应的原码和反码

16bit表示数值时(-32768)没有相对应的原码和反码, (-32768) = (1000 0000 0000 0000)  

对应的-2的16n-1次方都没有对应的原码和反码


#include<iostream>
#include<string.h>
#include<stdio.h>
using namespace std;
int main(int argc,char *argv[])
{

 char str[1000];

 int i;
 for(i = 0;i< 1000;i++)
 {
  str[i]= -1- i;

 }
 

    cout << endl;
 printf("  str[0]%d\n",str[0]);
 printf("  str[1]%d\n",str[1]);
 printf("  str[127]%d\n",str[127]);
 printf("  str[128]%d\n",str[128]);//高位发生溢出-129的补码是

                                                        -129 = -128 + (-1)

                                                   -128   ==  -0 补码 1000 0000

                                                         1000 0000

                                                    +   1111 1111

                                                       10111 1111

                                                   高位溢出 则补码为 0111 1111   0x7f  为正数

                                                                  对应原码  0111 1111   值为127
 printf("  str[129]%d\n",str[129]);     
 printf("  str[255]%d\n",str[255]);
 printf("  str[256]%d\n",str[256]);
 printf("  str[257]%d\n",str[257]);
 cout << "length(str)" << strlen(str)<<endl;

     return 0;
}



<span style="font-size:24px;"></span>
<span style="font-size:24px;">#include<iostream>#include<string.h>#include<stdio.h>using namespace std;int main(int argc,char *argv[]){char str[1000];int i;for(i = 0;i< 1000;i++){str[i]= -1- i;}    cout << endl;printf("  str[0]%d\n",str[0]);printf("  str[1]%d\n",str[1]);printf("  str[127]%d\n",str[127]);printf("  str[128]%d\n",str[128]);printf("  str[129]%d\n",str[129]);printf("  str[255]%d\n",str[255]);printf("  str[256]%d\n",str[256]);printf("  str[257]%d\n",str[257]);cout << "length(str)" << strlen(str)<<endl;     return 0;}</span>















0 0