大小端字节序的区别

来源：互联网发布：java 单个文件压缩编辑：程序博客网时间：2024/06/08 19:32

内存是以字节为单位读写的，其最小的读写单位就是字节。故如果在内存中写入一个字节，一个内存的存储单元便可以将其容纳了，只要访问这一内存地址就能完整的取出这一字节。但是一个字节只能够表示0~255（只考虑无符号数），超过这一范围的数只好用多个字节连在一起表示，因此，在我们32位程序中，定义的数据类型有很多，一字节的数据类型只有char型，像int要占四个字节，double要占八个字节，那么这么多个字节该以什么顺序存放呢。我们以0x1234为例，可以产生两种排序：
（1）小端字节序是数值的低字节放在内存的低地址处，数值高的高字节放在内存的高地址。
（2）大端字节序是数值的低字节放在内存的高地址处，数值高的高字节放在内存的低地址。
我们可以写一个程序判断我们pc到底是哪一种字节序：

#include<stdio.h>int main(){    union    {        short value;        char union_bytes[sizeof(short)];    }test;    test.value=0x0102;    if((test.union_bytes[0]==1)&&(test.union_bytes[1]==2))    {        printf("big endian\n");    }    else if((test.union_bytes[0]==2)&&(test.union_bytes[1]==1))    {        printf("little endian\n");    }    else    {        printf("unknown...\n");    }}

先看看这两种字节序的优势：
（1）小端：因为低位在低字节，强制转换数据类型时不需要调整字节了。
（2）大端：有符号位。其字节最高位不仅表示数值本身，而且还起到了符号的作用。符号固定为第一字节，也就是最高位占据最低地址，符号可以取出来，容易判断正负。
原理如下：
在做强制数据转换时，如果转换是由低精度到高精度，这数值本身没什么变换，如short两个字节，变成int为四个字节，无非就是由0x1234到0x00001234，数值上不变，只是存储形式变了。如果转化是由高精度到低精度，丢弃的是高字节，只保留低字节，如0x12345678在转化后变成0x5678。
对大端的优势，符号判定更方便，因为符号存储在低字节，可以直接取到，不用在跨越几个字节，减少了时钟周期。

常见CPU的字节序如下：
（1）大端字节序：IBM,Sun，PowerPC。
（2）小端字节序：×86，DEC。
ARM体系的CPU大小端字节序通吃，具体由硬件选择。另外常说的网络字节序就是大端字节序，所以在×86架构上的程序发送网络数据时，要转换字节序。转换方法可在我的Linux服务器编程栏目中可见。

阅读全文

0 0