IP ICMP TCP UDP 校验和

来源:互联网 发布:php 转成隐藏域 编辑:程序博客网 时间:2024/05/18 11:08
         首先,IP、ICMP、UDP和TCP报文头部都有校验和字段,大小都是16bit,算法也基本一样:

         在发送数据时,为了计算数据包的校验和。应该按如下步骤:

  (1)把校验和字段置为0;
  (2)把需校验的数据看成以16位为单位的数字组成,依次进行二进制反码求和;
  (3)把得到的结果存入校验和字段中。
  在接收数据时,计算数据包的校验和相对简单,按如下步骤:
  (1)把首部看成以16位为单位的数字组成,依次进行二进制反码求和,包括校验和字段;
  (2)检查计算出的校验和的结果是否为0;
  (3)如果等于0,说明被整除,校验是和正确。否则,校验和就是错误的,协议栈要抛弃这个数据包。



        虽然上面四种报文的校验和算法一样,但在作用范围存在不同:IP校验和只校验20字节的IP报头;而ICMP校验和覆盖整个报文(ICMP报头+ICMP数据);UDP和TCP校验和不仅覆盖整个报文,而且还有12字节的IP伪首部,包括源IP地址(4字节)、目的IP地址(4字节)、协议(2字节,第一字节补0)和TCP/UDP包长(2字节)。另外UDP、TCP数据报的长度可以为奇数字节,所以在计算校验和时需要在最后增加填充字节0(注意,填充字节只是为了计算校验和,可以不被传送)。

        这里还要提一点,UDP的校验和是可选的,当校验和字段为0时,表明该UDP报文未使用校验和,接收方就不需要校验和检查了!那如果UDP校验和的计算结果是0时怎么办呢?书上有这么一句话:“如果校验和的计算结果为0,则存入的值为全1(65535),这在二进制反码计算中是等效的。


讲了这么多,那这个校验和到底是怎么算的呢?

1. 什么是二进制反码求和

        对一个无符号的数,先求其反码,然后从低位到高位,按位相加,有溢出则向高位进1(跟一般的二进制加法规则一样),若最高位有进位,则向最低位进1。

        首先这里的反码好像跟我们以前学的有符号数的反码不一样(即正数的反码是其本身,负数的反码是在其原码的基础上,符号位不变,其余各位取反),这里不分正负数,直接每个位都取反!

        上面加粗的那句是跟我们一般的加法规则不太一样的地方:最高位有进位,则向最低位进1。确实有些疑惑,为什么要这样做呢?仔细分析一下(为了方便说明,以4bit二进制反码求和举例),上面的这种操作,使得在发生加法进位溢出时,溢出的值并不是10000,而是1111。也即是当相加结果满1111时溢出,这样也可以说明为什么0000和1111都表示0了(你同样可以发现,任何数与这两个数做二进制反码求和运算结果都是原数,这恰好符合数0的加法意义)。

        下面再举例两种二进制反码求和的运算:
        原码加法运算                                             反码加法运算
        3(0011)+ 5(0101)= 8(1000)     3(1100)+ 5(1010)=  8(0111)
        8(1000)+ 9(1001)= 1(0001)     8(0111)+ 9(0110)=  2(1101)
        从上面两个例子可以看出,当加法未发生溢出时,原码与反码加法运算结果一样;当有溢出时,结果就不一样了,原码是满10000溢出,而反码是满1111溢出,所以相差正好是1。举例只是为了形象地观察二进制反码求和的运算规则,至于为什么要定义这样的规则以及该运算规则还存在其它什么特性,可能就需要涉及代数理论的东西的了(呜呜~~数学理论没学好啊,只能从表面上分析分析)。

        另外关于二进制反码求和运算需要说明的一点是,先取反后相加与先相加后取反,得到的结果是一样的!(事实上我们的编程算法里,几乎都是先相加后取反。)



2. 校验和算法的实现


讲了什么是二进制反码求和,那么校验和的算法实现就简单多了。废话少说,直接上代码:

[cpp] view plaincopyprint?
  1. //计算校验和 
  2. USHORT checksum(USHORT *buffer,int size) 
  3.     unsigned long cksum=0; 
  4.     while(size>1) 
  5.     { 
  6.         cksum+=*buffer++; 
  7.         size-=sizeof(USHORT); 
  8.     } 
  9.     if(size) 
  10.     { 
  11.         cksum+=*(UCHAR *)buffer; 
  12.     } 
  13.     //将32位数转换成16 
  14.     while (cksum>>16) 
  15.         cksum=(cksum>>16)+(cksum & 0xffff); 
  16.     return (USHORT) (~cksum); 
buffer是指向需校验数据缓存区的指针,size是需校验数据的总长度(字节为单位)

4~13行代码对数据按16bit累加求和,由于最高位的进位需要加在最低位上,所以cksum必须是32bit的unsigned long型,高16bit用于保存累加过程中的进位;另外代码10~13行是对size为奇数情况的处理!

14~16行代码的作用是将cksum高16bit的值加到低16bit上,即把累加中最高位的进位加到最低位上。这里使用了while循环,判断cksum高16bit是否非零,因为第16行代码执行的时候,仍可能向cksum的高16bit进位。
有些地方是通过下面两条代码实现的:
cksum = (cksum >> 16) + (cksum & 0xffff);
cksum += (cksum >>16);
这里只进行了两次相加,即可保证相加后cksum的高16位为0,两种方式的效果一样。事实上,上面的循环也最多执行两次!

17行代码即对16bit数据累加的结果取反,得到二进制反码求和的结果,然后函数返回该值。



3. 为什么使用二进制反码求和呢?

       好了,最后一个问题,为什么要使用二进制反码来计算校验和呢,而不是直接使用原码或者补码?
        这个问题我想了很久,由于水平有限实在弄不明白,于是在百度上一阵狂搜,什么都没有(不知道是百度不给力,还是大家都不关注这个问题呢?)。果断换google,敲了3个关键词:why checksum tcp,嘿嘿 结果第二篇就是我想要的文章了!!!
先把链接给大家吧:http://www.netfor2.com/checksum.html
这篇文章主要介绍二进制反码求和(the 1's complement sum)与补码求和(the 2's complement sum)的区别,另外还说明了在TCP/IP校验和中使用反码求和的优点。

It may look awkword to use a 1's complement addition on 2's complement machines. This method however has its own benefits.

Probably the most important is that it is endian independent. Little Endian computers store hex numbers with the LSB last (Intel processors for example). Big Endian computers put the LSB first (IBM mainframes for example). When carry is added to the LSB to form the 1's complement sum (see the example) it doesn't matter if we add 03 + 01 or 01 + 03. The result is the same.

Other benefits include the easiness of checking the transmission and the checksum calculation plus a variety of ways to speed up the calculation by updating only IP fields that have changed.

       上面是原文的一部分,说明在TCP/IP校验和中使用反码求和的一些优点:

       a. 不依赖系统是大端还是小端。 即无论你是发送方计算或者接收方检查校验和时,都不需要调用htons 或者 ntohs,直接通过上面第2节的算法就可以得到正确的结果。这个问题你可以自己举个例子,用反码求和时,交换16位数的字节顺序,得到的结果相同,只是字节顺序相应地也交换了;而如果使用原码或者补码求和,得到的结果可能就不相同!

       b. 计算和验证校验和比较简单,快速。说实话,这个没怎么看明白,感觉在校验和计算方面,原码或者补码求和反而更简单一些(从C语言角度),在校验和验证上面,通过一样的算法判断结果是否为全0,确实要方便一些,所以可能从综合考虑确实反码求和要简便一些。另外,IP报文在传输过程中,路由器经常只修改TTL字段(减1),此时路由器转发该报文时可以直接增加它的校验和,而不需要对IP整个首部进行重新计算。当然,可能从汇编语言的角度看,反码求和还有很多高效的地方,这里就不在深入追究了~~~

 

另一篇关于校验和的文章,里面包含利用汇编实现校验和的方法

tcp层的校验值难道还需要ip层的元数据也就是ip头吗?如果一切都是理想的显然不需要,因为这违背了分层隔离的原则,下层一定不能依赖上层,但是上层可以访问下层,还好tcp使用ip信息正是这一点。按照封包原则,封装到TCP层的时候,ip信息还没有封装上去,但是校验值却需要马上进行计算,所以必须手工构造一个伪头部来表示ip层的信息,怎么构造呢?在数据到tcp层的时候其实用户肯定知道数据发往何处,源地址和目的地址都有,只不过是还没有封装到数据上罢了,简单的例子就是在socket程序中,connect或者accept或者recvfrom以及sendto都会保留有地址信息,另外伪头中还将保留有传输层协议信息,所有这一切都是为了使得通信更加安全和缜密,试想如果一个中间人截获了一个icmp包,然后改为了udp包或发生什么,该udp不是随意的而是精心构造的,但是加入了伪头部如此之行为得逞就困难多了,因为伪头部中有协议字段,除此之外,任何错误的投递,错误的数据长度以及错误的协议都会被检测到。看一下伪头吧:

struct psd_head

{

__u32 saddr; // 源网络层地址

__u32 daddr; // 目的网络层地址

__u8 mbz; //赋0

__u8 ptcl; // 传输层协议

__u16 tcpudpl; //传输层长度

};

以下是一个简单的校验和校验码的计算函数

void tcpv4_check_addr( __u16 * ppkgdata )

{

char * indata;

__u16 ippktlen, udppktlen,tcppktlen,wd;

__u32 ipheadlen;

__u32 sum,i,pl,el;

struct psd_head psd;

struct iphdr * ipd;

struct tcphdr * tcpd;

struct udphdr * udpd;

__u16 * databegin;

indata = (char *)ppkgdata; //从MAC开始的整个帧

ipheadlen = 14 + (indata[14]&0x0f)*4 ; //MAC和ip头的长度和

databegin = (__u16 *)(indata + ipheadlen); //ip数据

ipd = (struct iphdr *)(indata + 14); //MAC数据

tcpd = (struct tcphdr *)(indata + ipheadlen); //ip数据

ippktlen = htons(ipd->tot_len); //ip头和ip数据的总长度

if(ipd->protocol == 0x6){

tcppktlen = ippktlen +14 - ipheadlen; //tcp头和tcp数据的总长度

tcpd->check = 0;

psd.saddr = ipd->saddr; //构造伪头部

psd.daddr = ipd->daddr;

psd.mbz=0;

psd.ptcl = 0x06; //ip的下一个头

psd.tcpudpl = htons(tcppktlen);

sum = 0;

wd = tcppktlen/2; //每次数据前移16位而不是一个字节

for(i=0;i<wd;i++){ p="" 计算数据的校验和<="">

sum += *databegin;

databegin++;

}

el = tcppktlen - wd*2;

if(el != 0)

sum += (*databegin&0xff);

wd = sizeof(struct psd_head)/2;

databegin = (__u16 *) &psd.saddr;

for(i=0;i<wd;i++){ p="" 加上伪头的校验和<="">

sum += *databegin;

databegin++;

}//下面这个表达式就是高低16分别相加,sum/65536就是高16位:sum<<16

pl = (sum + sum/65536)&0xffff;

sum = 0xffff^pl;

tcpd->check = (__u16)sum; //检验和的计算很简单,就是将数据相加并且回卷之后取反

}

return;

}

以上的算法再清晰不过了,甚至将tcp,ip头部的偏移怎么计算都表达了出来,但是这个函数并不适用于实际情况,因为在高负载网络环境下,特别是NAT或者数据过滤网关环境下,校验和的计算是一个很频繁的过程,因此上述函数的c语言本质将很影响效率,取而代之的是用汇编实现,正如linux内核中的那样:

static inline __sum16 csum_fold(__wsum sum)

{

__asm__(

"addl %1, %0 ;/n"

"adcl $0xffff, %0 ;/n"

: "=r" (sum)

: "r" ((__force u32)sum << 16),

"" ((__force u32)sum & 0xffff0000)

);

return (__force __sum16)(~(__force u32)sum >> 16);

}

static inline __wsum csum_tcpudp_nofold(__be32 saddr, __be32 daddr, unsigned short len, unsigned short proto, __wsum sum)

{

__asm__(

"addl %1, %0 ;/n"

"adcl %2, %0 ;/n"

"adcl %3, %0 ;/n"

"adcl $0, %0 ;/n"

: "=r" (sum)

: "g" (daddr), "g"(saddr), "g"((len + proto) << 8), ""(sum));

return sum;

}

static inline __sum16 csum_tcpudp_magic(__be32 saddr, __be32 daddr, unsigned short len, unsigned short proto, __wsum sum)

{

return csum_fold(csum_tcpudp_nofold(saddr,daddr,len,proto,sum));

}

别看一个小小的计算校验和,它本质上影响了网络传输的效率,如果用tcpv4_check_addr这个函数计算校验和,效率慢了10倍之多,但是用汇编取而代之的话,效率虽然由于额外吸收而有所下降,但是数量级并没有改变。

 

原创粉丝点击