c++结构体内存对齐原理和方法

来源:互联网 发布:live直播软件下载 编辑:程序博客网 时间:2024/06/05 02:43
​面试过程中,经常会被问到结构体内存的问题。即结构体内部数据成员并不是按照所占空间大小顺序存储的。这样就会导致:一个结构体变量定义完之后,其在内存中的存储并不等于其所包含元素的宽度之和。引用别人的总结:“假设我们同时声明两个变量:
文章大部分内容转自
http://blog.csdn.net/liukun321/article/details/6974282
http://blog.csdn.net/u010510962/article/details/51039094

假设我们同时声明两个变量: 
char a; 
short b; 
用&(取地址符号)观察变量a, 
b的地址的话,我们会发现(以16位CPU为例): 
如果a的地址是0x0000,那么b的地址将会是0x0002或者是0x0004。 
那么就出现这样一个问题:0x0001这个地址没有被使用,那它干什么去了? 答案就是它确实没被使用。 因为CPU每次都是从以2字节(16位CPU)或是4字节(32位CPU)的整数倍的内存地址中读进数据的。如果变量b的地址是0x0001的话,那么CPU就需要先从0x0000中读取一个short,取它的高8位放入b的低8位,然后再从0x0002中读取下一个short,取它的低8位放入b的高8位中,这样的话,为了获得b的值,CPU需要进行了两次读操作。

但是如果b的地址为0x0002, 那么CPU只需一次读操作就可以获得b的值了。所以编译器为了优化代码,往往会根据变量的大小,将其指定到合适的位置,即称为内存对齐(对变量b做内存对齐,a、b之间的内存被浪费,a并未多占内存)


 一个结构体变量定义完之后,其在内存中的存储并不等于其所包含元素的宽度之和。
例一:
                                      #include <iostream>
                                      using namespace std;
                                         struct X
                                         {
                                              char a;
                                              int b;
                                              double c;
                                         }S1;
 
                                     void main()
                                    {
                                         cout << sizeof(S1) << endl;
                                         cout << sizeof(S1.a) << endl;
                                         cout << sizeof(S1.b) << endl;
                                         cout << sizeof(S1.c) << endl;
                                    }
     比如例一中的结构体变量S1定义之后,经测试,会发现sizeof(S1)= 16,其值不等于sizeof(S1.a) = 1、sizeof(S1.b) = 4和 sizeof(S1.c) = 8三者之和,这里面就存在存储对齐问题。
    原则一:结构体中元素是按照定义顺序一个一个放到内存中去的,但并不是紧密排列的。从结构体存储的首地址开始,每一个元素放置到内存中时,它都会认为内存是以它自己的大小来划分的,因此元素放置的位置一定会在自己宽度的整数倍上开始(以结构体变量首地址为0计算)。
    比如此例,首先系统会将字符型变量a存入第0个字节(相对地址,指内存开辟的首地址);然后在存放整形变量b时,会以4个字节为单位进行存储,由于第一个四字节模块已有数据,因此它会存入第二个四字节模块,也就是存入到4~8字节;同理,存放双精度实型变量c时,由于其宽度为8,其存放时会以8个字节为单位存储,也就是会找到第一个空的且是8的整数倍的位置开始存储,此例中,此例中,由于头一个8字节模块已被占用,所以将c存入第二个8字节模块。整体存储示意图如图1所示。
    考虑另外一个实例。
例二:
                                           struct X
                                           {
                                                char a;
                                                double b;
                                                int c;
                                            }S2;
    在例二中仅仅是将double型的变量和int型的变量互换了位置。测试程序不变,测试结果却截然不同,sizeof(S2)=24,不同于我们按照原则一计算出的8+8+4=20,这就引出了我们的第二原则。
    原则二:在经过第一原则分析后,检查计算出的存储单元是否为所有元素中最宽的元素的长度的整数倍,是,则结束;若不是,则补齐为它的整数倍。
    掌握了这两个原则,就能够分析所有数据存储对齐问题了。再来看几个例子,应用以上两个原则来判断。
例三:
                                              struct X
                                              { 
                                                   double a;
                                                   char b;
                                                   int c;     
                                              }S3;
    首先根据原则一来分析。按照定义的顺序,先存储double型的a,存储在第0~7个字节;其次是char型的b,存储在第8个字节;接下来是int型的c,顺序检查后发现前面三个四字节模块都被占用,因此存储在第4个四字节模块,也就是第12~15字节。按照第一原则分析得到16个字节,16正好是最宽元素a的宽度8的整数倍,因此结构体变量S3所占存储空间就是16个字节。
例四:
                                              struct X
                                              { 
                                                   double a;
                                                   char b;
                                                   int c;
                                                   char d;   
                                              }S4;
 
    仍然首先按照第一原则分析,得到的字节数为8+4+4+1=17;再按照第二原则补齐,则结构体变量S4所占存储空间为24。
例五:
                                              struct X
                                              { 
                                                   double a;
                                                   char b;
                                                   int c;
                                                   char d;
                                                   int e; 
                                               }S5;
    同样结合原则一和原则二分析,可知在S4的基础上在结构体内部变量定义最后加入一个int型变量后,结构体所占空间并未增加,仍为24。
例六:
    如果将例五中加入的变量e放到第一个定义的位置,则情况就不同了。结构体所占存储空间会变为32。
            
             struct X                                              {                                                   int e;                                                  double a;                                                  char b;                                                  int c;                                                  char d;                                              }S6;

                              
    补充:前面所介绍的都是元素为基本数据类型的结构体,那么含有指针、数组或是其它结构体变量或联合体变量时该如何呢?
    1.包含指针类型的情况。只要记住指针本身所占的存储空间是4个字节就行了,而不必看它是指向什么类型的指针。
例七:
                    struct X              struct Y               struct Z
                    {                     {                      {     
                       char *a;              int *b;                 double *c;
                    };                     };                     };
    经测试,可知sizeof(X)、sizeof(Y)和sizeof(Z)的值都为4。
    2.含有构造数据类型(数组、结构体和联合体)的情况。首先要明确的是计算存储空间时要把构造体看作一个整体来为其开辟存储空间;其次要明确的是在最后补齐时是按照所有元素中的基本数据类型元素的最长宽度来补齐的,也就是说虽然要把构造体看作整体,但在补齐的时候并不会按照所含结构体所占存储空间的长度来补齐的(即使它可能是最长的)。
例八:
                                      struct X
                                     {
                                          char a;
                                          int b;
                                          double c;
                                      };
                                      struct Y
                                      {
                                           char a;
                                           X b;
                                       };
    经测试,可知sizeof(X)为16,sizeof(Y)为24。即计算Y的存储长度时,在存放第二个元素b时的初始位置是在double型的长度8的整数倍处,而非16的整数倍处,即系统为b所分配的存储空间是第8~23个字节。
    至于结构体若包含了其他结构体,则只用把包含的结构体替换进来即可。
    如果将Y的两个元素char型的a和X型的b调换定义顺序,则系统为b分配的存储位置是第0~15个字节,为a分配的是第16个字节,加起来一共17个字节,不是最长基本类型double所占宽度8的整数倍,因此要补齐到8的整数倍,即24。测试后可得sizeof(Y)的值为24。
    由于结构体所占空间与其内部元素的类型有关,而且与不同类型元素的排列有关,因此在定义结构体时,在元素类型及数量确定之后,我们还应该注意一下其内部元素的定义顺序。

原创粉丝点击