大端存储 小端存储 (终极版本Byte Endian是指字节在内存中的组织,所以也称它为Byte Ordering,或Byte Order。 对于数据中跨越多个字节的对象, 我们必须为它建)

来源:互联网 发布:网络虚拟化技术 编辑:程序博客网 时间:2024/04/29 16:23

参考文章:

http://blog.sina.com.cn/s/blog_79a076a101016hhf.html

http://blog.csdn.net/aaronin/article/details/7700771

http://www.cnblogs.com/daxu/archive/2012/08/14/2638278.html

什么是大端小端存储:(百度百科)

大端模式,是指数据的高位保存在内存的低地址中,而数据的低位保存在内存的高地址中,这样的存储模式有点儿类似于把数据当作字符串顺序处理:地址由小向大增加,而数据从高位往低位放;
小端模式,是指数据的高位保存在内存的高地址中,而数据的低位保存在内存的低地址中,这种存储模式将地址的高低和数据位权有效地结合起来,高地址部分权值高,低地址部分权值低,和我们的逻辑方法一致。

为什么要有大端小端存储:(百度百科)

这是因为在计算机系统中,我们是以字节为单位的,每个地址单元都对应着一个字节,一个字节为 8bit。但是在C语言中除了8bit的char之外,还有16bit的short型,32bit的long型(要看具体的编译器),另外,对于位数大于 8位的处理器,例如16位或者32位的处理器,由于寄存器宽度大于一个字节,那么必然存在着一个如何将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。


先说几个前提:

存储器存储数据都是从低地址向高地址存储。

内存中数据是以字节为单位进行存储的,每个地址单元对应着一个字节(byte),一个字节为8位(bite)。

以32位CPU为例,要存储数据0x12345678,这里采用16进制表示法,就是以4位为一组,而一个字节有8位,所以2个16进制数就可以表示了(4X2)。

既然是从低地址向高地址存储:

数据总有个先后顺序,我们默认刚才0x12345678,我们知道是从右向左位数越来越高的。就好像我们平时的任意一个数2014也是从右向左位数越来越高的,只不过进制不同而已,注意这只是数据显示的一种表示方法,跟它的存储顺序无关

既然以字节为单位,所以(0x12),( 0x34),(0x56),( 0x78)就无法分开,而且他们还是有序的要么就 0x12,0x34,0x56,0x78,要么就0x78,0x56,0x34,0x12。

关键来了,

大端存储:高字节存储在低地址,高位先存

小端存储:低字节存储在低地址,低位先存

所以我们知道了大小对应着高低,而高先就是大,低先就是小了。

图示:

起始地址为0x4000。
大端存储如下: 

 地址  0x4000  0x4001  0x4002  0x4003  内容  0x12  0x34  0x56 0x78小端存储如下:

 地址  0x4000  0x4001  0x4002  0x4003  内容  0x78  0x56 0x34  0x12

口诀:先高大先低小


这样我们搞清楚了如果按照给定的大端小端的存储规则,数据存储时是怎么在内存中存放的。

但这个大端小端的规则又是怎么来的呢?

外水:其实没必要往下看了,随手粘贴

Byte Endian是指字节在内存中的组织,所以也称它为Byte Ordering,或Byte Order。
     对于数据中跨越多个字节的对象, 我们必须为它建立这样的约定:
(1) 它的地址是多少?
(2) 它的字节在内存中是如何组织的?
    针对第一个问题,有这样的解释:
    对于跨越多个字节的对象,一般它所占的字节都是连续的,它的地址等于它所占字节最低地址。(链表可能是个例外, 但链表的地址可看作链表头的地址)。
    比如: int x, 它的地址为0×100。 那么它占据了内存中的Ox100, 0×101, 0×102, 0×103这四个字节(32位系统,所以int占用4个字节)。
    上面只是内存字节组织的一种情况: 多字节对象在内存中的组织有一般有两种约定。 考虑一个W位的整数。
    它的各位表达如下:[Xw-1, Xw-2, ... , X1, X0],它的
    MSB (Most Significant Byte, 最高有效字节)为 [Xw-1, Xw-2, ... Xw-8];
    LSB (Least Significant Byte, 最低有效字节)为 [X7,X6,..., X0]。
    其余的字节位于MSB, LSB之间。

LSB和MSB谁位于内存的最低地址, 即谁代表该对象的地址?
这就引出了大端(Big Endian)与小端(Little Endian)的问题。
如果LSB在MSB前面, 既LSB是低地址, 则该机器是小端; 反之则是大端。
DEC (Digital Equipment Corporation,现在是Compaq公司的一部分)和Intel的机器(X86平台)一般采用小端。
IBM, Motorola(Power PC), Sun的机器一般采用大端。
当然,这不代表所有情况。有的CPU即能工作于小端, 又能工作于大端, 比如ARM, Alpha,摩托罗拉的PowerPC。 具体情形参考处理器手册。
具体这类CPU是大端还是小端,应该和具体设置有关。
(如,Power PC支持little-endian字节序,但在默认配置时是big-endian字节序)
一般来说,大部分用户的操作系统(如windows, FreeBsd,Linux)是Little Endian的。少部分,如MAC OS ,是Big Endian 的。
所以说,Little Endian还是Big Endian与操作系统和芯片类型都有关系。

Linux系统中,你可以在/usr/include/中(包括子目录)查找字符串BYTE_ORDER(或
_BYTE_ORDER, __BYTE_ORDER),确定其值。BYTE_ORDER中文称为字节序。这个值一般在endian.h或machine/endian.h文件中可以找到,有时在feature.h中,不同的操作系统可能有所不同。

大端模式与小端模式一、概念及详解  

在各种体系的计算机中通常采用的字节存储机制主要有两种: big-endian和little-endian,即大端模式和小端模式。  

先回顾两个关键词,MSB和LSB:  

MSB:Most Significant Bit ——- 最高有效位

LSB:Least Significant Bit ——- 最低有效位  

大端模式(big-edian)  big-endian:MSB存放在最低端的地址上。  

举例,双字节数0×1234以big-endian的方式存在起始地址0×00002000中:

| data |<– address

| 0×12 |<– 0×00002000

| 0×34 |<– 0×00002001   

在Big-Endian中,对于bit序列中的序号编排方式如下(以双字节数0×8B8A为例):

bit | 0 1 2 3 4 5 6 7 | 8 9 10 11 12 13 14 15

——MSB———————————-LSB

val | 1 0 0 0 1 0 1 1 | 1 0 0 0 1 0 1 0 |

+——————————————–+

= 0×8 B 8 A   

小端模式(little-endian)   little-endian:LSB存放在最低端的地址上。  

举例,双字节数0×1234以little-endian的方式存在起始地址0×00002000中:

| data |<– address

| 0×34 |<– 0×00002000

| 0×12 |<– 0×00002001   

在Little-Endian中,对于bit序列中的序号编排和Big-Endian刚好相反,其方式如下(以双字节数0×8B8A为例):

bit | 15 14 13 12 11 10 9 8 | 7 6 5 4 3 2 1 0

——MSB———————————–LSB

val | 1 0 0 0 1 0 1 1 | 1 0 0 0 1 0 1 0 |

+———————————————+

= 0×8 B 8 A

二、数组在大端小端情况下的存储:  

以unsigned int value = 0×12345678为例,分别看看在两种字节序下其存储情况,我们可以用unsigned char buf[4]来表示value:  Big-Endian: 低地址存放高位,如下:

高地址

—————

buf[3] (0×78) — 低位

buf[2] (0×56)

buf[1] (0×34)

buf[0] (0×12) — 高位

—————

低地址

Little-Endian: 低地址存放低位,如下:

高地址

—————

buf[3] (0×12) — 高位

buf[2] (0×34)

buf[1] (0×56)

buf[0] (0×78) — 低位

————–

低地址  

DEC (Digital Equipment Corporation,现在是Compaq公司的一部分)和Intel的机器(X86平台)一般采用小端。
IBM, Motorola(Power PC), Sun的机器一般采用大端。
当然,这不代表所有情况。有的CPU即能工作于小端, 又能工作于大端, 比如ARM, Alpha,摩托罗拉的PowerPC。 具体情形参考处理器手册。

同时,在网络传输中,网络协议需要指定网络字节顺序,TCP/IP协议中使用16位整数和32位整数的高位先存模式,对应我们的大端模式。

0 0
原创粉丝点击