为什么要用补码表示

来源：互联网发布：锐捷linux客户端下载编辑：程序博客网时间：2024/05/16 00:55

总是记不住计算机中的补码，反码等一些东西，今天又学习一次，把它们记录下来。

用补码的主要原因：使用补码，可以将符号位和其它位统一处理；同时，减法也可按加法来处理。另外，两个用补码表示的数相加时，如果最高位（符号位）有进位，则进位被舍弃。n位计算机，设n=8，所能表示的最大数是11111111，若再加1称为100000000(9位)，但因只有8位，最高位1自然丢失。又回了00000000，所以8位二进制系统的模为2(8)。在这样的系统中减法问题也可以化成加法问题，只需把减数用相应的补数表示就可以了。把补数用到计算机对数的处理上，就是补码[1]。

最直观的得到一个负数的补码的方法是用2⁸去减它，例如:

-1 的补码 100000000

 -) 00000001

------------

= 11111111   (实际上就是1 + (11111111 – 1),先计算括号内，相当于按位取反，然后再加上外面的1。

首先说说无符号数的表示，一个字节可以表示2⁸－1＝256个数，00000000～11111111 分别表示0～255。这个很简单。

对于无符号数，一个字节同样只能表示256个数，那么怎么表示负数，一个比较好的办法就是将字节的最高位表示为符号位，其余7位表示数值，表示范围为-128~127， 00000000～01111111表示0～127， ~~10000001~11111111表示-1~-127吗，错！~~，实际上是10000000～11111111分别对应表示-128~-1，怎么会是这样呢，是不是搞错了，没错的，这就是补码，负数在计算中是以补码来表示的。

那么补码是怎么得到的呢？为了说明这个问题，让我们来先了解一下什么是原码和反码的概念。

原码：数值有正负之分,计算机就用一个数的最高位存放符号(0为正,1为负).这就是机器数的原码了，原码表示范围为-127 ~ -0, +0 ~ +127，除了最高位表示符号位，正负数在其余各位的表示是相同的，例如10000001表示 -1， 11111111表示-127。原码表示虽然很简单，但人们很快就发现用原码来进行加减运算会出问题：假设字长为8bits [2]

( 1 ) ₁₀- ( 1 )₁₀ = ( 1 )₁₀ + ( -1 )₁₀ = ( 0 )₁₀

(00000001)原 + (10000001)原 = (10000010)原 = ( -2 ) 显然不正确

因为两个整数的相加没有问题，所以问题出在带符号位的负数上，人们将负数除符号位的其它位逐位取反，就得到了反码。

( 1 )₁₀ - ( 2)₁₀ = ( 1 )₁₀ + ( -2 )₁₀ = ( -1 )₁₀

(00000001) _反+ (11111101)_反 = (11111110)_反 = ( -1 ) 正确

发现反码表示后，将加减数都表示成反码后，减法可以直接表示成加法，其结果似乎是正确的。但是：

( 1 )₁₀ - ( 1 ) ₁₀= ( 1 ) ₁₀+ ( -1 ) ₁₀= ( 0 )₁₀

(00000001) _反+ (11111110)_反 = (11111111)_反 = ( -0 ) 有问题.

问题出现在(+0)和(-0)上,在人们的计算概念中零是没有正负之分的，于是就出现了补码，正数的补码不变，负数的补码是将其反码加1，这样表示后再看看上面的运算：

( 1 ) ₁₀- ( 1 ) ₁₀= ( 1 )₁₀ + ( -1 )₁₀ = ( 0 )₁₀

(00000001)_补 + (11111111)_补 = (00000000)_补 = ( 0 ) 正确

( 1 ) ₁₀- ( 2) ₁₀= ( 1 )₁₀ + ( -2 )₁₀ = ( -1 )₁₀

(00000001) _补+ (11111110) _补= (11111111)_补 = ( -1 ) 正确
P.S.
一的补码(one's complement) 指的是正数=原码,负数=反码
而二的补码(two's complement) 指的就是通常所指的补码

[1] 关于补码的概念http://blog.21ic.com/user1/3388/archives/2007/34974.html

[2] 闲扯原码、反码、补码http://dev.csdn.net/develop/article/17/17680.shtm