字节对齐

来源:互联网 发布:淘宝哪家零食店好 编辑:程序博客网 时间:2024/06/04 18:16

本文主要转载自【1】,不确定其是否为原创;同时对其中名称指代进行规格化,又添加了一个实例。

默认测试系统为32bit win。

1. 概述

为何要字节对齐?简单来说就是提高cpu对内存的访问效率。为了访问未对齐的内存,处理器需要作两次内存访问;然而,对齐的内存访问仅需要一次访问。比如有些平台每次读都是从偶地址开始,如果一个int型(假设为32位系统)存放在偶地址开始的地方 ,那么读一个周期就可以读出这32bit,而如果存放在奇地址开始的地方,就需要读2个周期,并对两次读出的结果的高低字节进行拼凑才能得到该32bit数据。


2. 基本概念

(1)数据类型自身的对齐值:任何基本数据类型T的自身对齐值就是T的大小,即sizeof(T)。

           char型、short型、int型、long型、float型、double型的自身对齐值分别为1、2、4、4、4、8,单位为字节。

(2)结构体或者类的自身对齐值:其成员变量自身对齐值中最大的那个值。

(3)指定对齐值:使用#pragma pack(value)时指定的对齐值。

(4)数据成员、结构体和类的有效对齐值:自身对齐值和指定对齐值中小的那个值。

(5)圆整值:编译器对结构体进行圆整(即,在结构体最末填充一定的字节)。圆整值大小为结构体的自身对齐值与#pragma pack(value)中指定的对齐值中较小的那个值。


3.字节对齐规则

有效对齐值N是最终用来决定数据存放地址方式的值。有效对齐值N,就是表示“对齐在N上”,也就是说该数据“存放起始地址%N=0”。而数据结构中数据变量都是按定义的先后顺序来排放的。第一个数据变量的起始地址就是数据结构的起始地址。结构体的成员变量要对齐排放,结构体本身也要根据自身的有效对齐值圆整(即结构体成员变量占用总长度需要对结构体有效对齐值的的整数倍)。
即:
(1)结构体变量的首地址能够被结构体有效对齐值整除。
(2)结构体每个成员相对于结构体首地址的偏移量(offset)都是该成员有效对齐值的整数倍。如有需要,编译器会在成员之间加上中间填充字节。
(3)最后对结构体进行圆整操作,结构体总大小为结构体有效对齐值的整数倍,如有需要,编译器会在最末一个成员之后加上末尾填充字节来进行圆整。
若出现结构体嵌套,则规则修改如下:
(1)结构体变量的首地址能够被结构体有效对齐值整除。
(2)结构体每个成员相对于结构体首地址的偏移量(offset)都是该成员有效对齐值的整数倍。如有需要,编译器会在成员之间加上中间填充字节。
(3)结构体的复合成员相对于结构体首地址的偏移量(offset)都是复合成员有效对齐值的整数倍。如有需要,编译器会在成员之间加上中间填充字节。
(4)最后对结构体进行圆整操作,结构体总大小为结构体有效对齐值的整数倍,如有需要,编译器会在最末一个成员之后加上末尾填充字节来进行圆整。
 

4.实例分析

    <实例一>
struct B  {      char a;      int c;      short b;   }; 

假设bType从地址空间0x0000开始排放。该例子中没有定义指定对齐值,在笔者环境下,该值默认为4。第一个成员变量a的自身对齐值是1,比指定或者默认指定对齐值4小,所以其有效对齐值为1,所以其存放地址0x0000,符合0x0000%1=0。第二个成员变量c,其自身对齐值为4,所以有效对齐值也为4, 所以只能存放在起始地址为0x0004到0x0007这四个连续的字节空间中,符合0x0004%4=0,且紧靠第一个变量。第三个变量b,自身对齐值为 2,所以有效对齐值也是2,可以存放在0x0008到0x0009这两个字节空间中,符合0x0008%2=0。所以从0x0000到0x0009存放的 都是bType内容。再看数据结构bType的自身对齐值为其数据成员中最大对齐值(这里是c)所以就是4,所以结构体的有效对齐值也是4。根据结构体圆整的要求, 0x0009到0x0000=10字节,(10+2)%4=0。所以0x0000A到0x000B也为结构体bType所占用。故bType从0x0000到0x000B 共有12个字节,sizeof(struct bType)=12。


其实如果就这一个来说它已经满足字节对齐了,因为它的起始地址是0,因此肯定是对齐的,之所以在后面补充2个字节,是因为编译器为了实现结构数组的存取效率,试想如果我们定义了一个结构bType的数组,那么第一个结构起始地址是0没有问题,但是第二个结构呢?按照数组的定义,数组中所有元素都是紧挨着的,如果我们不把结构的大小补充为4的整数倍,那么下一 个结构的起始地址将是0x0000A,这显然不能满足结构的地址对齐了,因此我们要把结构补充成有效对齐大小的整数倍。其实诸如:对于char型数据,其自身对齐值为1,对于short型为2,对于int、float类型及pointer,其自身对齐值为4,这些已有类型的自身对齐值也是基于数组考虑的,只是因为这些类型的长度已知了,所以他们的自身对齐值也就已知了。


         <实例二>

#pragma pack (2) /*指定按2字节对齐*/   typedef struct C  {      char a;      int c;      short b;  } cType;#pragma pack () /*取消指定对齐,恢复缺省对齐*/ 


第一个变量a的自身对齐值为1,指定对齐值为2,所以,其有效对齐值为1,假设cType从0x0000开始,那么a存放在0x0000,符合0x0000%1= 0;第二个变量c,自身对齐值为4,指定对齐值为2,所以有效对齐值为2,所以顺序存放在0x0002、0x0003、0x0004、0x0005四个连续 字节中,符合0x0002%2=0。第三个变量b的自身对齐值为2,所以有效对齐值为2,顺序存放在0x0006、0x0007中,符合 0x0006%2=0。所以从0x0000到0x00007共八字节存放的是cType的变量。 结构体cType的自身对齐值为4,同时cType的有效对齐值为2。因而0x0008%2=0,cType只占用0x0000到0x0007的八个字节。所以sizeof(struct cType)=8.
 

       <实例三>


typedef struct D   {      char a;      short b;    int c;  } dType;


在不修改默认对齐字节的情况下,采用上述方式声明结构体,也可达到缩小暂用字节,快速访问的目的;第一个变量a的自身对齐值为1,指定对齐值为4,所以,其有效对齐值为1,假设dType从0x0000开始,那么a存放在0x0000,符合0x0000%1= 0;在存储第二个变量前,圆整一个字节;第二个变量b,自身对齐值为2,指定对齐值为2,所以有效对齐值为2,所以顺序存放在0x0002、0x0003两个连续字节中,符合0x0002%2=0。第三个变量c的自身对齐值为2,所以有效对齐值为2,顺序存放在0x0004、0x0005、0x0006、0x0007中,符合 0x0004%4=0。所以从0x0000到0x00007共八字节存放的是dType的变量。结构体dType的自身对齐值为4,从而0x00008%4=0,dType只占用0x0000到0x0007的八个字节。所以sizeof(struct dType)=8.
  

5.如何修改编译器的默认对齐值

1.在VC IDE中,可以这样修改:[Project]|[Settings],c/c++选项卡Category的Code Generation选项的Struct Member Alignment中修改,默认是8字节。
2.在编码时,可以这样动态修改:#pragma pack (vaule).注意:是pragma而不是progma.

Ps: 使用VS2013但均没有实现,方法1没有找到该标签,方法2没有实现效果.

另外仍需要探索linux下的字节对齐细节。


参考

【1】内存中的数据对齐

【2】C结构体中数据的内存对齐问题


0 0
原创粉丝点击