源码，反码，补码，二进制反码求和

来源：互联网发布：java 时间控件编辑：程序博客网时间：2024/05/18 14:24

首先，什么是源码，反码，补码

原码

（1）原码：在数值前直接加一符号位的表示法。

例如：符号位数值位

[+7]原= 0 0000111 B

[-7]原= 1 0000111 B

注意：a. 数0的原码有两种形式：

定点小数表示方法

[+0]原=00000000B [-0]原=10000000B

b. 8位二进制原码的表示范围：-127～+127

反码

（2）反码：

正数：正数的反码与原码相同。

负数：负数的反码，符号位为“1”，数值部分按位取反。

浮点表示方法

例如：符号位数值位

[+7]反= 0 0000111 B

[-7]反= 1 1111000 B

注意：a. 数0的反码也有两种形式，即

[+0]反=00000000B

[- 0]反=11111111B

b. 8位二进制反码的表示范围：-127～+127

补码

（3）补码的表示方法

1）模的概念：把一个计量单位称之为模或模数。例如，时钟是以12进制进行计数循环的，即以12为模。在时钟上，时针加上（正拨）12的整数位或减去（反拨）12的整数位，时针的位置不变。14点钟在舍去模12后，成为（下午）2点钟（14=14-12=2）。从0点出发逆时针拨10格即减去10小时，也可看成从0点出发顺时针拨2格（加上2小时），即2点（0-10=-10=-10+12=2）。因此，在模12的前提下，-10可映射为+2。由此可见，对于一个模数为12的循环系统来说，加2和减10的效果是一样的；因此，在以12为模的系统中，凡是减10的运算都可以用加2来代替，这就把减法问题转化成加法问题了（注：计算机的硬件结构中只有加法器，所以大部分的运算都必须最终转换为加法）。10和2对模12而言互为补数。

同理，计算机的运算部件与寄存器都有一定字长的限制（假设字长为8），因此它的运算也是一种模运算。当计数器计满8位也就是256个数后会产生溢出，又从头开始计数。产生溢出的量就是计数器的模，显然，8位二进制数，它的模数为2^8=256。在计算中，两个互补的数称为“补码”。

2）补码的表示：

正数：正数的补码和原码相同。

负数：负数的补码则是符号位为“1”。并且，这个“1”既是符号位，也是数值位。数值部分按位取反后再在末位（最低位）加1。也就是“反码+1”。

例如：符号位数值位

[+7]补= 0 0000111 B

[-7]补= 1 1111001 B

补码在微型机中是一种重要的编码形式，请注意：

a. 采用补码后，可以方便地将减法运算转化成加法运算，运算过程得到简化。正数的补码即是它所表示的数的真值，而负数的补码的数值部份却不是它所表示的数的真值。采用补码进行运算，所得结果仍为补码。

b. 与原码、反码不同，数值0的补码只有一个，即 [0]补=00000000B。

c. 若字长为8位，则补码所表示的范围为-128～+127；进行补码运算时，应注意所得结果不应超过补码所能表示数的范围

校验和算法

经常看计算机网络相关的书时，每次看到关于IP或者是UDP报头校验和时，都是一笑而过，以为相当简单的东西，不就是16bit数据的相加吗！最近在学习Ping命令的源待时，看到里面有关于校验和的算法。一头雾水，后来查找资料，看到校验和是16bit字的二进制反码和。总是觉得很奇怪，为什么会用反码和，而不是直接求和呢？或者是补码和呢？因为在计算机里面数据是以补码的形式存在啊！经过看书查资料，下面总结一些这个校验和算法具体是怎么实现的。

首先，IP、ICMP、UDP和TCP报文头都有检验和字段，大小都是16bit，算法基本上也是一样的。

在发送数据时，为了计算数据包的检验和。应该按如下步骤：

1、把校验和字段设置为0；

2、把需要校验的数据看成以16位为单位的数子组成，依次进行二进制反码求和；

3、把得到的结果存入校验和字段中

在接收数据时，计算数据包的检验和相对简单，按如下步骤：

1、把首部看成以16位为单位的数字组成，依次进行二进制反码求和，包括校验和字段；

2、检查计算出的校验和的结果是否为0；

3、如果等于0，说明被整除，校验和正确。否则，校验和就是错误的，协议栈要抛弃这个数据包。

虽然说上面四种报文的校验和算法一样，但是在作用范围存在不同：IP校验和只校验20字节的IP报头；而ICMP校验和覆盖整个报文(ICMP报头+ICMP数据)；UDP和TCP校验和不仅覆盖整个报文，而且还有12个字节的IP伪首部，包括源IP地址(4字节)、目的IP地址(4字节)、协议(2字节)、TCP/UDP包长(2字节)。另外UDP、TCP数据报的长度可以为奇数字节，所以在计算校验和时需要在最后增加填充字节0(填充字节只是为了计算校验和，可以不被传送)。

在UDO传输协议中，校验和是可选的，当校验和字段为0时，表明该UDP报文未使用校验和，接收方就不需要校验和检查了！那如果UDP校验和的计算结果是0时怎么办？书上有一句话：“如果校验和的计算结果为0，则存入的值为全1(65535)，这在二进制反码计算中是等效的”

那么校验和到底怎么计算了？

1、什么是二进制反码求和

对一个无符号的数，先求其反码，然后从低位到高位，按位相加，有益处则向高位进1(和一般的二进制法则一样),若最高位有进位，则向最低位进1.

首先这里的反反码好像和以前学的有符号反码不一样，这里不分正负数，直接每个为都取反。

上面加粗的那句话和我们平时的加法法则不一样，最高位有进位，则向最低位进1。确实有些疑惑，为什么要这样呢？自习分析一下，上面的这种操作，使得在发送加法进位溢出时，溢出值并不是10000，而是1111.也即是当相加结果满1111时溢出，这样也可以说明为什么0000和1111都表示0了。

下面是两种二进制反码求和的运算：

原码加法运算：3(0011)+5(0101)=8(1000)

8(1000)+9(1001)=1(0001)

反码加法运算：3(1100)+5(1010)=8(0111)

8(0111)+9(0110)=2(1101)

从上面的例子中，当加法未发生溢出时，原码与反码加法运算结果一样；当有溢出时，结果就不一样了，原码是满10000溢出，而反码是满1111溢出，所以相差正好是1.

另外，关于二进制反码求和运算需要说明的一点是，先取反后相加与先相加后取反，得到的结果是一样的。

以4bit（计算方便一点，和16bit是一样的）做检验和来验证。

建设原始数据为 1100 ， 1010 ， 0000（校验位）

那么把他们按照4bit一组进行按位取反相加。 1100取反0011 ， 1010取反是0101，0011加上0101 是1000，填入到校验位后

1100 ， 1010 ， 1000

那么这个就是要发送的数据。收到数据后同样进行按位取反相加。0011+0101+0111 =1111；全为1表示正确

另外注意，当地一步计算校验和的时候，有可能相加后最高位会有进位，那么不能舍弃，一定要加到低位，才能是结果正确。
详细出处参考：http://www.jb51.net/article/30028.htm

2、校验和算法实现

代码如下：

USHORT checksum (USHORT *buffer,int size)

{

Unsigned long cksum=0;

While (size>1)

{

Cksum +=*buffer++;

size -=sizeof(USHORT);

}

If (size)

{

Cksum +=*(UCHAR *) buffer;

}

//将32位转换为16位

While (cksum>>16)

Cksum = (cksum>>16) + (cksum & 0xffff);

Return (USHORT) (~cksum);

}

buffer是指向需要校验数据缓冲区的指针，size是需要检验数据的总长度(字节为单位)。

4-13行代码是对数据按16bit累加求和，由于最高位的进位需要加在最低位上，所以cksum必须是32位的unsigned long型，高16bit用于保存累加过程中的进位；另外代码10~13行是对size为奇数情况的处理。

14~16行代码的作用是将cksum高16bit的值加到低16bit上，即把累加中最高位的进位加到最低位上。这里使用了while循环，判断cksum高16bit是否非零，因为第16行代码执行的时候，还是可能向cksum的高16bit进位。

有些地方是通过下面两条代码实现的：

Cksum = (cksum >> 16) + (cksum & 0xffff);

Cksum = (cksum >> 16);

这里只进行了两次相加，即可保证相加后cksum的高16位为0，两种方式的效果是一样，事实上，上面的循环也最多执行两次！

17行代码即对16bit数据累加的结果取反，得到二进制反码求和的结果，然后函数返回该值。

3、为什么使用二进制反码求和呢？

为什么要使用二进制反码来计算校验和呢，而不是直接使用原码或者是补码呢？

在谷歌上找到一篇相关的文章：

上面是原文的一部分，说明在TCP/IP校验和中使用反码求和的一些优点：

a、不依赖系统是大端小端。即无论你是发送方计算机或者接收方检查校验和时，都不要调用htons或者ntohs，直接通过上面的算法就可以得到正确的结果。这个问题你可以自己举个例子，用反码求和时，交换16位数的字节顺序，得到的结果相同，只是字节顺序相应地也交换了；而如果使用原码或者补码求和，得到的结果可能就不同。

b、计算和验证校验和比较简单、快递。

0 0

源码，反码，补码，二进制 反码求和

原码

反码

补码

源码，反码，补码，二进制反码求和