计算机中的原码、反码、补码（上）

来源：互联网发布：仿斗鱼直播源码编辑：程序博客网时间：2024/05/17 02:22

正数：原码、反码、补码是一样的

负数：反码 = 除去符号位按位取反

补码 = 反码加1

计算机里存储的是补码

注：

要注意溢出情况

列如： char i；

它所能存储的范围是-128 ----- +127 总共是256个数

原本是-127 --- -0 和 +0 --- +127

+0 原码 0000 0000

反码0000 0000

补码0000 0000

-0 原码1000 0000

反码1111 1111

补码10000 0000 1溢出舍去 -----0000 0000

所以+0 -0 在计算机中补码是一样的，反码之间相距0 — -127 共128个数

因为计算机反码对于-0 +0 有所区分，所以引入补码人们通常把-128 作为 -0

负数在计算机中如何表示？

举例来说，+8在计算机中表示为二进制的1000，那么-8怎么表示呢？

很容易想到，可以将一个二进制位（bit）专门规定为符号位，它等于0时就表示正数，等于1时就表示负数。比如，在8位机中，规定每个字节的最高位为符号位。那么，+8就是00001000，而-8则是10001000。

但是，随便找一本《计算机原理》，都会告诉你，实际上，计算机内部采用补码（Two's Complement）表示负数。

什么是补码？

它是一种数值的转换方法，要分二步完成：

第一步，每一个二进制位都取相反值，0变成1，1变成0。比如，00001000的相反值就是11110111。

第二步，将上一步得到的值加1。11110111就变成11111000。

所以，00001000的补码就是11111000。也就是说，-8在计算机（8位机）中就是用11111000表示。

不知道你怎么看，反正我觉得很奇怪，为什么要采用这么麻烦的方式表示负数，更直觉的方式难道不好吗？

昨天，我在一本书里又看到了这个问题，然后就花了一点时间到网上找资料，现在总算彻底搞明白了。

补码的好处

首先，要明确一点。计算机内部用什么方式表示负数，其实是无所谓的。只要能够保持一一对应的关系，就可以用任意方式表示负数。所以，既然可以任意选择，那么理应选择一种最方便的方式。

补码就是最方便的方式。它的便利体现在，所有的加法运算可以使用同一种电路完成。

还是以-8作为例子。

假定有两种表示方法。一种是直觉表示法，即10001000；另一种是补码表示法，即11111000。请问哪一种表示法在加法运算中更方便？

随便写一个计算式，16 + (-8) = ?

16的二进制表示是 00010000，所以用直觉表示法，加法就要写成：

　０００１００００
＋１０００１０００
－－－－－－－－－
　１００１１０００

可以看到，如果按照正常的加法规则，就会得到10011000的结果，转成十进制就是-24。显然，这是错误的答案。也就是说，在这种情况下，正常的加法规则不适用于正数与负数的加法，因此必须制定两套运算规则，一套用于正数加正数，还有一套用于正数加负数。从电路上说，就是必须为加法运算做两种电路。

现在，再来看补码表示法。

　０００１００００
＋１１１１１０００
－－－－－－－－－
１００００１０００

可以看到，按照正常的加法规则，得到的结果是100001000。注意，这是一个9位的二进制数。我们已经假定这是一台8位机，因此最高的第9位是一个溢出位，会被自动舍去。所以，结果就变成了00001000，转成十进制正好是8，也就是16 + (-8) 的正确答案。这说明了，补码表示法可以将加法运算规则，扩展到整个整数集，从而用一套电路就可以实现全部整数的加法。

补码的本质

在回答补码为什么能正确实现加法运算之前，我们先看看它的本质，也就是那两个步骤的转换方法是怎么来的。

要将正数转成对应的负数，其实只要用0减去这个数就可以了。比如，-8其实就是0-8。

已知8的二进制是00001000，-8就可以用下面的式子求出：

　００００００００
－００００１０００
－－－－－－－－－

因为00000000（被减数）小于0000100（减数），所以不够减。请回忆一下小学算术，如果被减数的某一位小于减数，我们怎么办？很简单，问上一位借1就可以了。

所以，0000000也问上一位借了1，也就是说，被减数其实是100000000，算式也就改写成：

１００００００００
－００００１０００
－－－－－－－－－
　１１１１１０００

进一步观察，可以发现100000000 = 11111111 + 1，所以上面的式子可以拆成两个：

　１１１１１１１１
－００００１０００
－－－－－－－－－
　１１１１０１１１
＋０００００００１
－－－－－－－－－
　１１１１１０００

补码的两个转换步骤就是这么来的。

为什么正数加法适用于补码？

实际上，我们要证明的是，X-Y或X+(-Y)可以用X加上Y的补码完成。

Y的补码等于(11111111-Y)+1。所以，X加上Y的补码，就等于：

X + (11111111-Y) + 1

我们假定这个算式的结果等于Z，即 Z = X + (11111111-Y) + 1

接下来，分成两种情况讨论。

第一种情况，如果X小于Y，那么Z是一个负数。这时，我们就对Z采用补码的逆运算，求出它对应的正数绝对值，再在前面加上负号就行了。所以，

Z = -[11111111-(Z-1)] = -[11111111-(X + (11111111-Y) + 1-1)] = X - Y

第二种情况，如果X大于Y，这意味着Z肯定大于11111111，但是我们规定了这是8位机，最高的第9位是溢出位，必须被舍去，这相当于减去100000000。所以，

Z = Z - 100000000 = X + (11111111-Y) + 1 - 100000000 = X - Y

这就证明了，在正常的加法规则下，可以利用补码得到正数与负数相加的正确结果。换言之，计算机只要部署加法电路和补码电路，就可以完成所有整数的加法。

（完）

Z = X + (11111111-Y) + 1式子可以写为Z = X - Y +100000000，这在硬件上可以理解为两部分电路来实现，第一部分是前面的X - Y（这里姑且不管计算的结果是正还是负），第二部分是X - Y计算的结果再和100000000相加，最终得到计算的结果Z, 而在8位的计算机上100000000是不能出现的，其实这时100000000就相当于00000000（舍去了最高位），然后我们再看一些计算的过程：
Z = X + （11111111 - Y) + 1
= X - Y + 100000000
= X - Y + 00000000
= X - Y
证毕。
这样我们就证明了X-Y或X+(-Y)可以用X加上Y的2的补码完成，而不必分两种情况来证明。

如-1的原码是10000001，和1的原码在数值位上相同，那么 -1的反码就是11111110，

而补码就是在反码的基础上加1，即-1的补码是11111110+1=11111111，因此我们可以

算出-1在计算机中是按11111111储存的。总结一下，计算机储存有符号的整数时，是

用其补码进行储存的，0的原码、补码都是0，正数的原码、补码可以特殊理解为相同，

负数的补码是它的反码加1。下面再多举几个例子，来帮助大家理解！

十进制　→　二进制　　（怎么算？要是不知道看计算机基础的书去）

47　　　→　101111

有符号的整数　　　　原码　　　　反码　　　　补码

　　47　　　　　　00101111　　00101111　　00101111（正数不区分原码、反码和

补码）

　－47　　　　　　10101111　　11010000　　11010001（负数补码是在反码上加1）

再举个例子，学C语言的同学应该做过这道题：

把－1以无符号的类型输出，得什么结果？（程序如下）

#include<iostream.h>

void main()

{

short int n=-1;

cout<<(unsigned short int)n<<endl;

}

　　首先在我的电脑中short int类型的储存空间是2个字节，你的可能不同，我说过，这

取决于你的计算机配置。它能储存2^8*2＝65536个不同的数据信息，如果是无符号那么它

的范围是0~65535（0~2¹⁶-1），如果是有符号，那么它的范围是-32768~32767（-2¹⁵~

2¹⁵-1）。这道题目中，开始n是一个有符号的短整型变量，我们给它赋值为-1，根据我

们前面所说的，它在计算机中是以补码11111111 11111111储存的，注意前面说了是2

个字节。如果把它强制为无符号的短整型输出的话，那么我们就把刚才的二进制把看成

无符号的整型在计算机中储存的形式，对待无符号的整型就没有什么原码、反码和补码

的概念了，直接把11111111 11111111转化成十进制就是65535，其实我们一看都是一

就知道它是范围中最大的一个数了。呵呵，就这么简单。你个把上面的源代码编译运行

看看，如果你的电脑short int也是两个字节，那就会和我得一样的结果。你可以先用这

个语句看看：cout<<sizeof(short int)<<endl;看看你的电脑里的短整型占多少的储存空

间，也可以用sizeof来看其它任何类型所分配的储存空间。

　　最后提醒一句，关于数据如何在计算机中储存的，这里只适用于整型的数据，对于

浮点型的是另一种方式，这里我们暂时就不深究了。

补码的计算和引进补码的原因：

数值有正负之分,计算机就用一个数的最高位存放符号(0为正,1为负).

这就是机器数的原码了.假设机器能处理的位数为8.即字长为1byte，

原码能表示数值的范围为(-127~-0 +0~127)共256个.

有了数值的表示方法就可以对数进行算术运算.

但是很快就发现用带符号位的原码进行乘除运算时结果正确,

而在加减运算的时候就出现了问题,如下: 假设字长为8bits

( 1 ) 10-  ( 1 )10 =  ( 1 )10 + ( -1 )10 =  ( 0 )10

(00000001)原 + (10000001)原 = (10000010)原 = ( -2 ) 显然不正确.

因为在两个整数的加法运算中是没有问题的,于是就发现问题出现在带符号位的负数身上,
对除符号位外的其余各位逐位取反就产生了反码.反码的取值空间和原码相同且一一对应.
下面是反码的减法运算:

( 1 )10 -  ( 1 ) 10=  ( 1 ) 10+ ( -1 ) 10=  ( 0 )10

(00000001) 反+ (11111110)反 =  (11111111)反 =  ( -0 )  有问题.

( 1 )10 -  ( 2)10 =  ( 1 )10 + ( -2 )10 =  ( -1 )10

(00000001) 反+ (11111101)反 =  (11111110)反 =  ( -1 ) 正确

问题出现在(+0)和(-0)上,在人们的计算概念中零是没有正负之分的.

于是就引入了补码概念. 负数的补码就是对反码加一,而正数不变,正数的原码反码补码是

一样的.

在补码中用(-128)代替了(-0),所以补码的表示范围为:(-128~0~127)共256个.已知某数的

补码,

先求某数的反码,然后在对反码+1,就得到某数的原码.比如:

已知某个数的补码是:10100110

先对10100110求反,得:11011001

再对11011001加1,得: 11011010

那么这个数为-86

原码表示的范围为:－（2^(n-1)－1）~＋（2^(n-1)－1），

反码表示的范围为与原码一样.

补码表示的范围为：－2^(n-1)~＋（2^(n-1)－1），

其中n为机器字长。

注意:

0的补码是唯一的,为0000,0000 [+0]补=[-0]补=0000,0000 -0的反码为1111,1111

8bit表示数值时(-128)没有相对应的原码和反码, (-128) = (10000000)

补码的加减运算如下:

( 1 ) 10- ( 1 ) 10= ( 1 )10 + ( -1 )10 = ( 0 )10

(00000001)补 + (11111111)补 =  (00000000)补 = ( 0 ) 正确

( 1 ) 10-  ( 2) 10=  ( 1 )10 + ( -2 )10 =  ( -1 )10

(00000001) 补+ (11111110) 补=  (11111111)补 = ( -1 )  正确

所以补码的设计目的是:

⑴使符号位能与有效值部分一起参加运算,从而简化计算机的运算规则.

⑵使减法运算转换为加法运算,进一步简化计算机中运算器的线路设计

所有这些转换都是在计算机的最底层进行的，而在我们使用的汇编、C等其他高级语言

中使用的都是原码。

看了上面这些大家应该对原码、反码、补码的知识印象更深了吧！！

个人总结：

负数的原码与其对应正数的原码除符号位（最高位）相反外（负数的符号位为1，正数

的符号位为0），其余数值位是相同的

可以这样认为，正数只有原码，其原码就是其二进制表示，正数在计算机中即是以其原

码形式存储的，负数有原码和补码，负数在计算机中是以其补码形式存储的

补码=原码的反码+1

原码表示的范围为:－（2^(n-1)－1）~＋（2^(n-1)－1），

反码表示的范围为与原码一样.

补码表示的范围为：－2^(n-1)~＋（2^(n-1)－1），

其中n为机器字长。

注意:

0的补码是唯一的,为0000,0000 [+0]补=[-0]补=0000,0000 -0的反码为1111,1111

8bit表示数值时(-128)没有相对应的原码和反码, (-128) = (1000 0000)

对应的-2的8n-1次方都没有对应的原码和反码

16bit表示数值时(-32768)没有相对应的原码和反码, (-32768) = (1000 0000 0000 0000)

对应的-2的16n-1次方都没有对应的原码和反码

#include<iostream>
#include<string.h>
#include<stdio.h>
using namespace std;
int main(int argc,char *argv[])
{

char str[1000];

int i;
for(i = 0;i< 1000;i++)
{
str[i]= -1- i;

}

cout << endl;
printf(" str[0]%d\n",str[0]);
printf(" str[1]%d\n",str[1]);
printf(" str[127]%d\n",str[127]);
printf(" str[128]%d\n",str[128])；//高位发生溢出-129的补码是

-129 = -128 + （-1）

-128 == -0 补码 1000 0000

1000 0000

+ 1111 1111

10111 1111

高位溢出则补码为 0111 1111 0x7f 为正数

对应原码 0111 1111 值为127
printf(" str[129]%d\n",str[129]);
printf(" str[255]%d\n",str[255]);
printf(" str[256]%d\n",str[256]);
printf(" str[257]%d\n",str[257]);
cout << "length(str)" << strlen(str)<<endl;

return 0;
}

<span style="font-size:24px;"></span>

<span style="font-size:24px;">#include<iostream>#include<string.h>#include<stdio.h>using namespace std;int main(int argc,char *argv[]){char str[1000];int i;for(i = 0;i< 1000;i++){str[i]= -1- i;}    cout << endl;printf("  str[0]%d\n",str[0]);printf("  str[1]%d\n",str[1]);printf("  str[127]%d\n",str[127]);printf("  str[128]%d\n",str[128]);printf("  str[129]%d\n",str[129]);printf("  str[255]%d\n",str[255]);printf("  str[256]%d\n",str[256]);printf("  str[257]%d\n",str[257]);cout << "length(str)" << strlen(str)<<endl;     return 0;}</span>

0 0