C位域与大小端字节序 间关系

来源:互联网 发布:手机看美剧的软件 编辑:程序博客网 时间:2024/04/30 17:25

C位域与字节序的关系,本文内容转载自:http://www.cnblogs.com/zhangxian/articles/3503460.html

如下代码

  1. #include "stdio.h" 
  2. struct kk 
  3. unsigned a:2; 
  4. unsigned b:3; 
  5. unsigned c:2; 
  6. unsigned d:1; 
  7. kt; 
  8. int main() 
  9.         char result =3; 
  10.         memcpy(&kt,&result,1); 
  11.         printf(" a = %d, b = %d, c = %d, d = %d,ok/n",kt.a,kt.b,kt.c,kt.d); 
  12.         return 1; 

 

在sun unix上用cc编译,结果为0,0,1,1

在2000上用VC6.0编译,结果为3,0,0,0

=================================================

解释一下,呵呵:

C语言的位域虽然很多人强烈建议不要使用,但现有系统里还广泛存在位域的使用,所以还是很有必要理清楚的。

对big-endian和little-endian的区别,很多人认为是对多字节数据类型而言。其实,问题的本质不在这里。

两种endian区别的本质是由于CPU的数据引脚和系统地址总线的连接方向的不同。也就是说,高地址,低地址的区别不仅体现在“字节序”上,还体现在“比特序”上,只不过因为系统屏蔽了“比特序”的一些细节,所以看起来问题仅仅是字节之间的顺序问题了。

 

所以,对字节序相关的问题,如果能从两个角度来看问题,就很直接明了了。

先从系统地址总线的角度来分析数据的存放,然后从CPU的数据引脚的角度来解析数据....(对网络字节,可从网络数据传送地址的角度分析数据的存放,思想类同)

 

废话少说,分析一下上面的例子程序。(所有图表都从系统地址总线的角度看各个bit位)

C语言的位域中,每个field是严格按照bit地址从低到高排列的:

因此,从地址总线的角度看,四个域的排列顺序是(用于解析)

==============

-低->->->高-

  a b c d

==============

 

接下来看如何解析这个字节。

在little-endian机器上,result字节中各个比特的存放排列如下所示

==============

-低->->->高-

,11000000,

==============

对应到四个位域,得

a=3

b=0

c=0

d=0

 

在big-endian机器上,result字节中各个比特的存放排列如下所示

==============

-低->->->高-

,00000011,

==============

对应到四个位域,得

a=0

b=0

c=1

d=1

 

 

总结:

1.  C语言的位域类型使用时,各个field的摆放是按从低到高的bit顺序排列的。

2.  把数据的存放和解析分开,就可以很容易解释字节序的问题。

 

是这样的。这里有个术语的混淆。当多个字节组成一个长字(long)时,不同体系结构的cpu会按不同的方法来解释高低字节的顺序,这是字节序。小端的cpu会将低地址的字节认为是长字值的低位,高地址的字节认为是长字值得高位。大端的正好相反。

而在一个字节之内,不同体系结构的cpu会按不同的方法来解释高低比特的顺序,这是比特序。 小端的cpu将低位的比特认为是值得低位,高位的比特认为是值得高位。大端的正好相反。假设固定总线上的比特地址,从0比特到7比特的内存数据是 0 0 0 0 0 0 0 1。那么,小端的cpu读到的值就是0x80,而大端的cpu读到的值就是0x01。

INTEL的cpu字节序和比特序都是小端的。POWERPC的cpu一般都是大端的.

 

明白以上道理,你可以分析IP header了.

 

  1. struct iphdr 
  2.   { 
  3. #if __BYTE_ORDER == __LITTLE_ENDIAN 
  4.     unsigned int ihl:4; 
  5.     unsigned int version:4; 
  6. #elif __BYTE_ORDER == __BIG_ENDIAN 
  7.     unsigned int version:4; 
  8.     unsigned int ihl:4; 
  9. #else 
  10. # error "Please fix <bits/endian.h>" 
  11. #endif 
  12.     u_int8_t tos; 
  13.     u_int16_t tot_len; 
  14.     u_int16_t id; 
  15.     u_int16_t frag_off; 
  16.     u_int8_t ttl; 
  17.     u_int8_t protocol; 
  18.     u_int16_t check; 
  19.     u_int32_t saddr; 
  20.     u_int32_t daddr; 
  21.     /*The options start here. */ 
  22.   }; 

 

以及 tcp header

  1. struct tcphdr 
  2.   { 
  3.     u_int16_t source; 
  4.     u_int16_t dest; 
  5.     u_int32_t seq; 
  6.     u_int32_t ack_seq; 
  7. #  if __BYTE_ORDER == __LITTLE_ENDIAN 
  8.     u_int16_t res1:4; 
  9.     u_int16_t doff:4; 
  10.     u_int16_t fin:1; 
  11.     u_int16_t syn:1; 
  12.     u_int16_t rst:1; 
  13.     u_int16_t psh:1; 
  14.     u_int16_t ack:1; 
  15.     u_int16_t urg:1; 
  16.     u_int16_t res2:2; 
  17. #  elif __BYTE_ORDER == __BIG_ENDIAN 
  18.     u_int16_t doff:4; 
  19.     u_int16_t res1:4; 
  20.     u_int16_t res2:2; 
  21.     u_int16_t urg:1; 
  22.     u_int16_t ack:1; 
  23.     u_int16_t psh:1; 
  24.     u_int16_t rst:1; 
  25.     u_int16_t syn:1; 
  26.     u_int16_t fin:1; 
  27. #  else 
  28. #   error "Adjust your <bits/endian.h> defines" 
  29. #  endif 
  30.     u_int16_t window; 
  31.     u_int16_t check; 
  32.     u_int16_t urg_ptr; 
  33. }; 

0 0