内存的字节存储大小端问题（一）

来源：互联网发布：电脑数据恢复工具编辑：程序博客网时间：2024/06/08 08:24

内存大小端判断

思路：联合体union的存放顺序是所有成员都从低地址开始存放，利用该特性就可以轻松地获得了
  CPU对内存是采用Little-endian还是Big-endian模式读写。
给出c代码，linux其实也差不了多少
#include<iostream>
using namespace std;

union Judge
{
  short s;
  char ch[sizeof(short)];
};
Judge flag;

int main()
{
  flag.s = 0x0102;

  if ( sizeof(short) !=2 )
  {
  cout<<" 测得short类型有"<<sizeof(short)<<"个字节"<<endl;
  }

  if ( flag.ch[0] == 2 && flag.ch[1] == 1 )
  {
  cout<<"你用的电脑处理器是小端模式！"<<endl;
  }

  else if ( flag.ch[0] == 1 && flag.ch[1] == 2 )
  {
  cout<<"你用的电脑处理器是大端模式！"<<endl;
  }


  else
  {
  cout<<"未知模式"<<endl;
  }

  system("pause");
  return 0;
===========================================================

大端与数字顺序一致

小端倒序

数字：0x12345678

大端：

0x100 0x101 0x102 0x103

12 34 56 78

小端：

0x100 0x101 0x102 0x103

78 56 34 12

原则：

大端一致（即数字顺序一致）

小端倒序

一、什么是大小端问题

(From《Computer Systems,A Programer's Perspective》)在几乎所有的机器上，多字节对象被存储为连续的字节序列，对象的地址为所使用字节序列中最低字节地址。

小端：某些机器选择在存储器中按照从最低有效字节到最高有效字节的顺序存储对象，这种最低有效字节在最前面的表示方式被称为小端法(little endian) 。这样的存储模式有点儿类似于把数据当作字符串顺序处理：地址由小向大增加，而数据从高位往低位放；

大端：某些机器则按照从最高有效字节到最低有效字节的顺序储存，这种最高有效字节在最前面的方式被称为大端法(big endian) 。这种存储模式将地址的高低和数据位权（即个十百千万...）有效地结合起来，高地址部分权值高，低地址部分权值低，和我们的逻辑方法一致。

二、为什么会有大小端模式之分呢？

这是因为在计算机系统中，我们是以字节为单位的，每个地址单元都对应着一个字节，一个字节为 8bit。但是在C语言中除了8bit的char之外，还有16bit的short型，32bit的long型（要看具体的编译器），另外，对于位数大于 8位的处理器，例如16位或者32位的处理器，由于寄存器宽度大于一个字节，那么必然存在着一个如果将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。

例如一个16bit的short型x，在内存中的地址为0x0010，x的值为0x1122，那么0x11为高字节，0x22为低字节。

对于大端模式，就将0x11放在低地址中，即0x0010中，0x22放在高地址中，即0x0011中。

小端模式，则刚好相反。

=============================================

端模式分为：大端字节序和小端字节序，也就是字节在内存中的顺序。

内存中存放数据的顺序是：由低到高。

大端字节序：高字节存于内存低地址，低字节存于内存高地址。如一个long型数据0x12345678

内存低地址--> 0x12

　　　　.　　0x34

　　　　.　　0x56
内存高地址--> 0x78

小端字节序：低字节存于内存低地址，高字节存于内存高地址。

内存低地址--> 0x78
               .    　　0x56
               .    　　0x34
内存高地址--> 0x12

注意：

字节的大端序还是小端序是由CPU决定的。

我们常用的X86结构是小端模式，而KEIL C51则为大端模式。很多的ARM，DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式还是小端模式。

网络字节序：就是大端字节序。规定不同系统间通信一律采用网络字节序。

在VC中的实验如下：

int temp = 0x12345678;

　　调试中，该变量在内存中的表现形式是78 56 34 12，但其真实的数值还是0x12345678,只不过

内存中表现的字节顺序与我们所认为的字节顺序刚好是反着的，同时也说明我的PC是遵循大端字节序的。

=========================================================

需要考虑大小端（字节顺序）的情况？

1、所写的程序需要向不同的硬件平台迁移，说不定哪一个平台是大端还是小端，为了保证可移植性，一定提前考虑好。

2. 在不同类型的机器之间通过网络传送二进制数据时。一个常见的问题是当小端法机器产生的数据被发送到大端法机器或者反之时，接受程序会发现，字(word)里的字节(byte)成了反序的。为了避免这类问题，网络应用程序的代码编写必须遵守已建立的关于字节顺序的规则，以确保发送方机器将它的内部表示转换成网络标准，而接受方机器则将网络标准转换为它的内部标准。

3. 当阅读表示整数的字节序列时。这通常发生在检查机器级程序时，e.g.：反汇编得到的一条指令：
80483bd: 01 05 64 94 04 08 add �x, 0x8049464

3. 当编写强转的类型系统的程序时。

例1：如写入的数据为u32型，但是读取的时候却是char型的：

如：0x1234, 大端读取为12时，小端独到的是34。

例2：将buffer中的数转换为整型：

如：int src = 0x1234

memcpy(buffer, src, sizeof(int));

大端：buffer[4] = {0x01, 0x02, 0x03, 0x04};

小端：buffer[4] = {0x04, 0x03, 0x02, 0x01};

提高程序的可移植性

使用宏编译

#ifdef LITTLE_ENDIAN

//小端的代码

#else

//大端的代码

#endif

大、小端之间的转换代码

1、小端转换为大端

#include <stdio.h>

void show_byte(char *addr, int len)

{

int i;

for (i = 0; i < len; i++)

{

printf("%.2x \t", addr[i]);

}

printf("\n");

}

int endian_convert(int t)

{

int result;

int i;

result = 0;

for (i = 0; i < sizeof(t); i++)

{

result <<= 8;

result |= (t & 0xFF);

t >>= 8;

}

return result;

}

int main(void)

{

int i;

int ret;

i = 0x1234567;

show_byte((char *)&i, sizeof(int));

ret = endian_convert(i);

show_byte((char *)&ret, sizeof(int));

return 0;

}