大端法、小端法、网络字节序转

来源：互联网发布：老虎证券美金知乎编辑：程序博客网时间：2024/06/16 12:17

大端法、小端法、网络字节序转

一.概念、定义

关于字节序(大端法、小端法)的定义

《UNXI网络编程》定义：术语“小端”和“大端”表示多字节值的哪一端(小端或大端)存储在该值的起始地址。小端存在起始地址，即是小端字节序；大端存在起始地址，即是大端字节序。

也可以说：
1.小端法(Little-Endian)就是低位字节排放在内存的低地址端即该值的起始地址，高位字节排放在内存的高地址端。
2.大端法(Big-Endian)就是高位字节排放在内存的低地址端即该值的起始地址，低位字节排放在内存的高地址端。

举个简单的例子，对于整形0x12345678。它在大端法和小端法的系统内中，分别如图1所示的方式存放。

zijiexu_pic_1

网络字节序

我们知道网络上的数据流是字节流，对于一个多字节数值，在进行网络传输的时候，先传递哪个字节？也就是说，当接收端收到第一个字节的时候，它是将这个字节作为高位还是低位来处理呢？
网络字节序定义：收到的第一个字节被当作高位看待，这就要求发送端发送的第一个字节应当是高位。而在发送端发送数据时，发送的第一个字节是该数字在内存中起始地址对应的字节。可见多字节数值在发送前，在内存中数值应该以大端法存放。
网络字节序说是大端字节序。
比如我们经过网络发送0x12345678这个整形，在80X86平台中，它是以小端法存放的，在发送前需要使用系统提供的htonl将其转换成大端法存放，如图2所示。

zijiexu_pic_2

字节序测试程序

不同cpu平台上字节序通常也不一样，下面写个简单的C程序，它可以测试不同平台上的字节序。

1 #include <stdio.h>2 #include <netinet/in.h>3 int main()4 {5     int i_num = 0x12345678;6     printf("[0]:0x%x\n", *((char *)&i_num + 0));7     printf("[1]:0x%x\n", *((char *)&i_num + 1));8     printf("[2]:0x%x\n", *((char *)&i_num + 2));9     printf("[3]:0x%x\n", *((char *)&i_num + 3));10  11     i_num = htonl(i_num);12     printf("[0]:0x%x\n", *((char *)&i_num + 0));13     printf("[1]:0x%x\n", *((char *)&i_num + 1));14     printf("[2]:0x%x\n", *((char *)&i_num + 2));15     printf("[3]:0x%x\n", *((char *)&i_num + 3));16  17     return 0;18 } 

在80X86CPU平台上，执行该程序得到如下结果：
[0]:0x78
[1]:0x56
[2]:0x34
[3]:0x12

[0]:0x12
[1]:0x34
[2]:0x56
[3]:0x78

分析结果，在80X86平台上，系统将多字节中的低位存储在变量起始地址，使用小端法。htonl将i_num转换成网络字节序，可见网络字节序是大端法。

二.判断大小端序

测试：

 1 #include <iostream> 2 using namespace std; 3  4 int main(int argc, char **argv) 5 { 6     short s = 0x0102; 7     if((*(unsigned char*)&s) == 2) 8         cout<<"little endian"<<endl; 9     else if((*(unsigned char*)&s) == 1)10         cout<<"big endian"<<endl;11     else12         cout<<"unknown endian\n"<<endl;13  14     return 0;15 }

请写一个C函数，若处理器是Big_endian的，则返回0；若是Little_endian的，则返回1

int checkCPU( )

{

union w

{

int a;

char b;

} c;

c.a = 1;

return(c.b ==1);

}

Big-Endian转换成Little-Endian如下：
#define BigtoLittle16(A) ((((uint16)(A) & 0xff00) >> 8) |
(((uint16)(A) & 0x00ff) << 8))
#define BigtoLittle32(A) ((((uint32)(A) & 0xff000000) >> 24) |
(((uint32)(A) & 0x00ff0000) >> 8) |
(((uint32)(A) & 0x0000ff00) << 8) |
(((uint32)(A) & 0x000000ff) << 24))

三.分析与什么有关系

端模式（Endian）的这个词出自Jonathan Swift书写的《格列佛游记》。这本书根据将鸡蛋敲开的方法不同将所有的人分为两类，从圆头开始将鸡蛋敲开的人被归为Big Endian，从尖头开始将鸡蛋敲开的人被归为Littile Endian。小人国的内战就源于吃鸡蛋时是究竟从大头（Big-Endian）敲开还是从小头（Little-Endian）敲开。在计算机业Big Endian和Little Endian也几乎引起一场战争。在计算机业界，Endian表示数据在存储器中的存放顺序。
PowerPC处理器主导网络市场，可以说绝大多数的通信设备都使用PowerPC处理器进行协议处理和其他控制信息的处理，这也可能也是在网络上的绝大多数协议都采用大端编址方式的原因。因此在有关网络协议的软件设计中，使用小端方式的处理器需要在软件中处理端模式的转变。而Pentium主导个人机市场，因此多数用于个人机的外设都采用小端模式，包括一些在网络设备中使用的PCI总线，Flash等设备，这也要求硬件工程师在硬件设计中注意端模式的转换。
使用大小端的处理器
常用的X86结构是小端模式，而C51单片机则为大端模式（8位的51没有大小端之说，但Keil C51编译器是大端的）。很多的ARM，DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式还是小端模式。SPARC处理器为大端处理器。
采用大端方式进行数据存放符合人类的正常思维，而采用小端方式进行数据存放利于计算机处理。到目前为止，采用大端或者小端进行数据存放，其孰优孰劣也没有定论。因此在一个处理器系统中，有可能存在大端和小端模式同时存在的现象。这一现象为系统的软硬件设计带来了不小的麻烦，这要求系统设计工程师，必须深入理解大端和小端模式的差别。大端与小端模式的差别体现在一个处理器的寄存器，指令集，系统总线等各个层次中。

0 0

大端法、小端法、网络字节序 转

大端法、小端法、网络字节序转