数据结构的内存分配、对齐,及指针加1的含义

来源:互联网 发布:夏川里美 知乎 编辑:程序博客网 时间:2024/05/21 16:30

[1]    指针变量+1,代表着什么?http://blog.csdn.net/bravekingzhang/article/details/6430590

[2]    结构体内存的空间分配原理,http://www.cnblogs.com/qintangtao/archive/2013/03/06/2945674.html

[3]    内存对齐详解,http://blog.csdn.net/sdwuyulunbi/article/details/8510401

 

本篇转载文章,我综合了以上三篇文献,并进行了梳理。

 

1  内存对齐及意义

内存地址对齐,是一种在计算机内存中排列数据(表现为变量的地址)、访问数据(表现为CPU读取数据)的一种方式,包含了两种相互独立又相互关联的部分:基本数据对齐和结构体数据对齐。

 

为什么需要内存对齐?对齐有什么好处?是我们程序员来手动做内存对齐呢?还是编译器在进行自动优化的时候完成这项工作?

 

在现代计算机体系中,每次读写内存中数据,都是按字(word,4个字节,对于X86架构,系统是32位,数据总线和地址总线的宽度都是32位,所以最大的寻址空间为232 = 4GB(也许有人会问,我的32位XP用不了4GB内存,关于这个不在本篇博文讨论范围),按A[31,30…2,1,0]这样排列,但是请注意为了CPU每次读写 4个字节寻址,A[0]和A[1]两位是不参与寻址计算的。)为一个块(chunks)来操作(而对于X64则是8个字节为一个块)。注意,这里说的 CPU每次读取的规则,并不是变量在内存中地址对齐规则。


既然是这样的,如果变量在内存中存储的时候也按照这样的对齐规则,就可以加快CPU读写内存的速度,当然也就提高了整个程序的性能,并且性能提升是客观,虽然当今的CPU的处理数据速度(是指逻辑运算等,不包括取址)远比内存访问的速度快,程序的执行速度的瓶颈往往不是CPU的处理速度不够,而是内存访问的延迟,虽然当今CPU中加入了高速缓存用来掩盖内存访问的延迟,但是如果高密集的内存访问,这种延迟是无可避免的,内存地址对齐会给程序带来了很大的性能提升。


内存地址对齐是计算机语言自动进行的,也即是编译器所做的工作。但这不意味着我们程序员不需要做任何事情,因为如果我们能够遵循某些规则,可以让编译器做得更好,毕竟编译器不是万能的。

 

为了更好理解上面的意思,这里给出一个示例。在32位系统中,假如一个int变量在内存中的地址是0x00ff42c3,因为int是占用4个字节,所以它的尾地址应该是0x00ff42c6,这个时候CPU为了读取这个int变量的值,就需要先后读取两个word大小的块,分别是0x00ff42c0~0x00ff42c3和0x00ff42c4~0x00ff42c7,然后通过移位等一系列的操作来得到,在这个计算的过程中还有可能引起一些总线数据错误的。但是如果编译器对变量地址进行了对齐,比如放在0x00ff42c0,CPU就只需要一次就可以读取到,这样的话就加快读取效率。

 

2  基本数据对齐

在X86,32位系统下基于Microsoft、Borland和GNU的编译器,有如下数据对齐规则:

a)       一个char(占用1-byte)变量以1-byte对齐。

b)       一个short(占用2-byte)变量以2-byte对齐。

c)       一个int(占用4-byte)变量以4-byte对齐。

d)       一个long(占用4-byte)变量以4-byte对齐。

e)       一个float(占用4-byte)变量以4-byte对齐。

f)        一个double(占用8-byte)变量以8-byte对齐。

g)       一个long double(占用12-byte)变量以4-byte对齐。

h)       任何pointer(占用4-byte)变量以4-byte对齐。

 

而在64位系统下,与上面规则对比有如下不同:

a)       一个long(占用8-byte)变量以8-byte对齐。

b)       一个double(占用8-byte)变量以8-byte对齐。

c)       一个long double(占用16-byte)变量以16-byte对齐。

d)       任何pointer(占用8-byte)变量以8-byte对齐。


3  结构体数据对齐

结构体数据对齐,是指结构体内的各个数据对齐。在结构体中的第一个成员的首地址等于整个结构体的变量的首地址,而后的成员的地址随着它声明的顺序和实际占用的字节数递增。为了总的结构体大小对齐,会在结构体中插入一些没有实际意思的字符来填充(padding)结构体。

结构体中成员数据对齐规则

1)       结构体中的第一个成员的首地址也即是结构体变量的首地址。

2)       结构体中的每一个成员的首地址相对于结构体的首地址的偏移量(offset),是根据该成员数据自己的对齐字节数和PPB(指定的对齐字节数,32位机默认为4)两个字节数最小的那个对齐。

3)       结构体的总大小是对齐模数(对齐模数等于#pragma pack(n)所指定的n与结构体中最大数据类型的成员大小的最小值)的整数倍。这样在处理数组时可以保证每一项都边界对齐。

4)       对于结构体成员属性中包含结构体变量的复合型结构体,在确定最宽基本类型成员时,应当包括复合类型成员的子成员。但在确定复合类型成员的偏移位置时则是将复合类型作为整体看待。

5)       还有一个额外的条件:结构体变量的首地址能够被其最宽基本类型成员的大小所整除。(不太理解)

 

最主要的是前面三个规则。

 

总结出一个公式:结构体的大小等于最后一个成员的偏移量加上其大小再加上末尾的填充字节数目,即:sizeof( struct ) = offsetof( last item ) + sizeof( last item )+sizeof( trailing padding )

 

示例一

struct

{

char a;

int b;

short c;

char d;

}dataAlign;

 

struct

{

char a;

char d;

short c;

int b;

}dataAlign2;

 

仔细观察,会发现虽然是一样的数据类型的成员,只不过声明的顺序不同,结构体占用的大小也不同,一个8-byte一个12-byte。为什么这样,下面进行具体分析。 

首先来看dataAlign2

第一个成员的地址等于结构体变量的首地址,

第二个成员char类型,为了满足规则2),它相对于结构体的首地址的偏移量必须是char=1的倍数,由于前面也是char,故不需要在第一个和第一个成员之间填充,直接满足条件。

第三个成员short=2如果要满足规则2),也不需要填充,因为它的偏移量已经是2。同样第四个也因为偏移量int=4,不需要填充,这样结构体总共大小为8-byte。

最后来验证规则c,在VC中默认 的#pragma pack(n)中的n=8,而结构体中数据类型大小最大的为第四个成员int=4,故对齐模数为4,并且8 mode 4 = 0,所以满足规则c。这样整个结构体的总大小为8。

 

对于dataAlign

第一个成员等于结构体变量首地址,偏移量为0,

第二个成员为int=4,为了满足规2),需要在第一个成员之后填充3-byte,让它相对于结构体首地址偏移量为4,结合运行结果,可知&dataAlign.a = 0x01109140,而&dataAlign.b = 0x01109144,它们之间相隔4-byte,0x01109141~0x01109143三个字节被0填充。

第三个成员short=2,无需填充满足规则2)。

第四个成员char=1,也不需要填充。结构体总大小相加4 + 4 + 2 + 1 = 11。

同样最后需要验证规则c,结构体中数据类型大小最大为第二个成员int=4,比VC默认对齐模数8小,故这个结构体的对齐模数仍然为4,显然11 mode 4 != 0,故为了满足规则c,需要在char后面填充一个字节,这样结构体变量dataAlign的总大小为4 + 4 + 2 + 2 = 12。

 

示例二

#include

#pragma pack(2)  //指定PPB为2

struct T{

char a;     //偏移地址0

int b;           //偏移地址2

char c;     //偏移地址6

};

 

#pragma pack()   //恢复原来默认PPB,32位下为4

int main(int argc,char * argv[])

{

printf("sizeof(struct T));

return 0;

}

 

最后输出的结果为:8。语句#pragma pack(2)的作用是指定结构体按2字节对齐,即PPB=2。分析如下:

 

变量a默认为1字节,PB=2,所以a按1字节对齐,a的偏移地址为0。

变量b默认为4字节(在32位机器中int为4字节),PB=2,所以b按2字节对齐,b的偏移地址为2。

变量c默认为1字节,PB=2,所以c按1字节对齐,偏移地址为6。

 

此时结构体的计算出的字节数为7个字节。最后按规则3,结构体对齐后的字节数为8。sizeof(T)=6+1+1=8

 

注意的问题

1)       字节对齐取决于编译器;

2)       一定要注意PPB大小,PPB大小由pragam pack(n)指定;

3)       结构体占用的字节数要能被PPB整除。

  

4  关于指针变量 +1

指针的加法的实现,

如int * pofa,pofa++或着pofa=pofa+1,会转换为pofa=pofa+sizeof(*pofa)*1,通过求指针指向变量的那个类型所占的字节数在乘指针偏移单位,然后做加法。

 

同时,对pofa=pofa+1后pofa所指的内存地址,仍然是按照pofa加1之前所指向的数据类型(int型)进行解读。要向转变解读方式,则需要使用类型转换,如(char*)(pofa+1)

0 0
原创粉丝点击