大小端字节序的区别

来源:互联网 发布:java 单个文件压缩 编辑:程序博客网 时间:2024/06/08 19:32

内存是以字节为单位读写的,其最小的读写单位就是字节。故如果在内存中写入一个字节,一个内存的存储单元便可以将其容纳了,只要访问这一内存地址就能完整的取出这一字节。但是一个字节只能够表示0~255(只考虑无符号数),超过这一范围的数只好用多个字节连在一起表示,因此,在我们32位程序中,定义的数据类型有很多,一字节的数据类型只有char型,像int要占四个字节,double要占八个字节,那么这么多个字节该以什么顺序存放呢。我们以0x1234为例,可以产生两种排序:
(1)小端字节序是数值的低字节放在内存的低地址处,数值高的高字节放在内存的高地址。
(2)大端字节序是数值的低字节放在内存的高地址处,数值高的高字节放在内存的低地址。
我们可以写一个程序判断我们pc到底是哪一种字节序:

#include<stdio.h>int main(){    union    {        short value;        char union_bytes[sizeof(short)];    }test;    test.value=0x0102;    if((test.union_bytes[0]==1)&&(test.union_bytes[1]==2))    {        printf("big endian\n");    }    else if((test.union_bytes[0]==2)&&(test.union_bytes[1]==1))    {        printf("little endian\n");    }    else    {        printf("unknown...\n");    }}

先看看这两种字节序的优势:
(1)小端:因为低位在低字节,强制转换数据类型时不需要调整字节了。
(2)大端:有符号位。其字节最高位不仅表示数值本身,而且还起到了符号的作用。符号固定为第一字节,也就是最高位占据最低地址,符号可以取出来,容易判断正负。
原理如下:
在做强制数据转换时,如果转换是由低精度到高精度,这数值本身没什么变换,如short两个字节,变成int为四个字节,无非就是由0x1234到0x00001234,数值上不变,只是存储形式变了。如果转化是由高精度到低精度,丢弃的是高字节,只保留低字节,如0x12345678在转化后变成0x5678。
对大端的优势,符号判定更方便,因为符号存储在低字节,可以直接取到,不用在跨越几个字节,减少了时钟周期。

常见CPU的字节序如下:
(1)大端字节序:IBM,Sun,PowerPC。
(2)小端字节序:×86,DEC。
ARM体系的CPU大小端字节序通吃,具体由硬件选择。另外常说的网络字节序就是大端字节序,所以在×86架构上的程序发送网络数据时,要转换字节序。转换方法可在我的Linux服务器编程栏目中可见。

原创粉丝点击