字节对齐

来源：互联网发布：淘宝哪家零食店好编辑：程序博客网时间：2024/06/04 18:16

本文主要转载自【1】，不确定其是否为原创；同时对其中名称指代进行规格化，又添加了一个实例。

默认测试系统为32bit win。

1. 概述

为何要字节对齐？简单来说就是提高cpu对内存的访问效率。为了访问未对齐的内存，处理器需要作两次内存访问；然而，对齐的内存访问仅需要一次访问。比如有些平台每次读都是从偶地址开始，如果一个int型（假设为32位系统）存放在偶地址开始的地方，那么读一个周期就可以读出这32bit，而如果存放在奇地址开始的地方，就需要读2个周期，并对两次读出的结果的高低字节进行拼凑才能得到该32bit数据。

2. 基本概念

（1）数据类型自身的对齐值：任何基本数据类型T的自身对齐值就是T的大小，即sizeof(T)。

char型、short型、int型、long型、float型、double型的自身对齐值分别为1、2、4、4、4、8，单位为字节。

（2）结构体或者类的自身对齐值：其成员变量自身对齐值中最大的那个值。

（3）指定对齐值：使用#pragma pack(value)时指定的对齐值。

（4）数据成员、结构体和类的有效对齐值：自身对齐值和指定对齐值中小的那个值。

（5）圆整值：编译器对结构体进行圆整（即，在结构体最末填充一定的字节）。圆整值大小为结构体的自身对齐值与#pragma pack(value)中指定的对齐值中较小的那个值。

3．字节对齐规则

有效对齐值N是最终用来决定数据存放地址方式的值。有效对齐值N，就是表示“对齐在N上”，也就是说该数据“存放起始地址%N=0”。而数据结构中数据变量都是按定义的先后顺序来排放的。第一个数据变量的起始地址就是数据结构的起始地址。结构体的成员变量要对齐排放，结构体本身也要根据自身的有效对齐值圆整（即结构体成员变量占用总长度需要对结构体有效对齐值的的整数倍）。
即：
（1）结构体变量的首地址能够被结构体有效对齐值整除。
（2）结构体每个成员相对于结构体首地址的偏移量（offset）都是该成员有效对齐值的整数倍。如有需要，编译器会在成员之间加上中间填充字节。
（3）最后对结构体进行圆整操作，结构体总大小为结构体有效对齐值的整数倍，如有需要，编译器会在最末一个成员之后加上末尾填充字节来进行圆整。
若出现结构体嵌套，则规则修改如下：
（1）结构体变量的首地址能够被结构体有效对齐值整除。
（2）结构体每个成员相对于结构体首地址的偏移量（offset）都是该成员有效对齐值的整数倍。如有需要，编译器会在成员之间加上中间填充字节。
（3）结构体的复合成员相对于结构体首地址的偏移量（offset）都是复合成员有效对齐值的整数倍。如有需要，编译器会在成员之间加上中间填充字节。
（4）最后对结构体进行圆整操作，结构体总大小为结构体有效对齐值的整数倍，如有需要，编译器会在最末一个成员之后加上末尾填充字节来进行圆整。

4．实例分析

<实例一>

struct B  {      char a;      int c;      short b;   };

假设bType从地址空间0x0000开始排放。该例子中没有定义指定对齐值，在笔者环境下，该值默认为4。第一个成员变量a的自身对齐值是1，比指定或者默认指定对齐值4小，所以其有效对齐值为1，所以其存放地址0x0000，符合0x0000%1=0。第二个成员变量c，其自身对齐值为4，所以有效对齐值也为4，所以只能存放在起始地址为0x0004到0x0007这四个连续的字节空间中，符合0x0004%4=0，且紧靠第一个变量。第三个变量b，自身对齐值为 2，所以有效对齐值也是2，可以存放在0x0008到0x0009这两个字节空间中，符合0x0008%2=0。所以从0x0000到0x0009存放的都是bType内容。再看数据结构bType的自身对齐值为其数据成员中最大对齐值(这里是c）所以就是4，所以结构体的有效对齐值也是4。根据结构体圆整的要求， 0x0009到0x0000=10字节，（10＋2）％4＝0。所以0x0000A到0x000B也为结构体bType所占用。故bType从0x0000到0x000B 共有12个字节，sizeof(struct bType)=12。

其实如果就这一个来说它已经满足字节对齐了，因为它的起始地址是0，因此肯定是对齐的，之所以在后面补充2个字节，是因为编译器为了实现结构数组的存取效率，试想如果我们定义了一个结构bType的数组，那么第一个结构起始地址是0没有问题，但是第二个结构呢？按照数组的定义，数组中所有元素都是紧挨着的，如果我们不把结构的大小补充为4的整数倍，那么下一个结构的起始地址将是0x0000A，这显然不能满足结构的地址对齐了，因此我们要把结构补充成有效对齐大小的整数倍。其实诸如：对于char型数据，其自身对齐值为1，对于short型为2，对于int、float类型及pointer，其自身对齐值为4，这些已有类型的自身对齐值也是基于数组考虑的，只是因为这些类型的长度已知了，所以他们的自身对齐值也就已知了。

<实例二>

#pragma pack (2) /*指定按2字节对齐*/   typedef struct C  {      char a;      int c;      short b;  } cType;#pragma pack () /*取消指定对齐，恢复缺省对齐*/

第一个变量a的自身对齐值为1，指定对齐值为2，所以，其有效对齐值为1，假设cType从0x0000开始，那么a存放在0x0000，符合0x0000%1= 0；第二个变量c，自身对齐值为4，指定对齐值为2，所以有效对齐值为2，所以顺序存放在0x0002、0x0003、0x0004、0x0005四个连续字节中，符合0x0002%2=0。第三个变量b的自身对齐值为2，所以有效对齐值为2，顺序存放在0x0006、0x0007中，符合 0x0006%2=0。所以从0x0000到0x00007共八字节存放的是cType的变量。结构体cType的自身对齐值为4，同时cType的有效对齐值为2。因而0x0008%2=0，cType只占用0x0000到0x0007的八个字节。所以sizeof(struct cType)=8.

<实例三>

typedef struct D   {      char a;      short b;    int c;  } dType;

在不修改默认对齐字节的情况下，采用上述方式声明结构体，也可达到缩小暂用字节，快速访问的目的；第一个变量a的自身对齐值为1，指定对齐值为4，所以，其有效对齐值为1，假设dType从0x0000开始，那么a存放在0x0000，符合0x0000%1= 0；在存储第二个变量前，圆整一个字节；第二个变量b，自身对齐值为2，指定对齐值为2，所以有效对齐值为2，所以顺序存放在0x0002、0x0003两个连续字节中，符合0x0002%2=0。第三个变量c的自身对齐值为2，所以有效对齐值为2，顺序存放在0x0004、0x0005、0x0006、0x0007中，符合 0x0004%4=0。所以从0x0000到0x00007共八字节存放的是dType的变量。结构体dType的自身对齐值为4，从而0x00008%4=0，dType只占用0x0000到0x0007的八个字节。所以sizeof(struct dType)=8.

5．如何修改编译器的默认对齐值

1.在VC IDE中，可以这样修改：[Project]|[Settings],c/c++选项卡Category的Code Generation选项的Struct Member Alignment中修改，默认是8字节。
2.在编码时，可以这样动态修改：#pragma pack (vaule).注意：是pragma而不是progma.

Ps: 使用VS2013但均没有实现，方法1没有找到该标签，方法2没有实现效果.

另外仍需要探索linux下的字节对齐细节。

参考

【1】内存中的数据对齐

【2】C结构体中数据的内存对齐问题

0 0