结构体对齐详解——转自“酱油和醋”

来源:互联网 发布:java 获取月份第一天 编辑:程序博客网 时间:2024/04/27 23:39

本文转自“酱油和醋”

原文链接:

http://www.cnblogs.com/motadou/archive/2009/01/17/1558438.html

结构体对齐详解

1 -- 结构体数据成员对齐的意义
许多实际的计算机系统对基本类型数据在内存中存放的位置有限制,它们会要求这些数据的起始地址的值是某个数k的倍数,这就是所谓的内存对齐,而这个k则被称为该数据类型的对齐模数(alignment modulus)。这种强制的要求一来简化了处理器与内存之间传输系统的设计,二来可以提升读取数据的速度。 
比如这么一种处理器,它每次读写内存的时候都从某个8倍数的地址开始,一次读出或写入8个字节的数据,假如软件能保证double类型的数据都从8倍数地址开始,那么读或写一个double类型数据就只需要一次内存操作。否则,我们就可能需要两次内存操作才能完成这个动作,因为数据或许恰好横跨在两个符合对齐要求的8字节内存块上。
2 -- 结构体对齐包括两个方面的含义
1)结构体总长度; 
2)结构体内各数据成员的内存对齐,即该数据成员相对结构体的起始位置;
3 -- 结构体大小的计算方法和步骤
1)将结构体内所有数据成员的长度值相加,记为sum_a; 
2)将各数据成员为了内存对齐,按各自对齐模数而填充的字节数累加到和sum_a上,记为sum_b。对齐模数是#pragma pack指定的数值】和结构体内部最大的基本数据类型成员长度中数值较大者。该数据相对起始位置应该是对齐模式的整数倍; 
3)将和sum_b向结构体模数对齐,该模数是【#pragma pack指定的数值】和【结构体内部最大的基本数据类型成员】长度中数值较小者。结构体的长度应该是该模数的整数倍。
4 -- 结构体大小计算举例
在计算之前,我们首先需要明确的是各个数据成员的对齐模数,对齐模数和数据成员本身的长度以及pragma pack编译参数有关,其值是二者中最小数。如果程序没有明确指出,就需要知道编译器默认的对齐模数值。下表是Windows XP/DEV-C++和Linux/GCC中基本数据类型的长度和默认对齐模数。 
  charshortintlongfloatdoublelong longlong doubleWin-32长度12444888模数12444888Linux-32长度124448812模数12444444Linux-64长度124848816模数124848816

例子1:

struct my_struct {     char a;     long double b; };

此例子Windows和Linux计算方法有些许不一致。 
在Windows中计算步骤如下: 
步骤1:所有数据成员自身长度和:1B + 8B = 9B --> sum_a = 9B 
步骤2:数据成员a放在相对偏移0处,之前不需要填充字节;数据成员b为了内存对齐,根据“结构体大小的计算方法和步骤”中第二条原则,其对齐模数是8,之前需填充7个字节,sum_a + 7 = 16B --> sum_b = 16 B 
步骤3:按照定义,结构体对齐模数是结构体内部最大数据成员长度,此处者为8所以结构体对齐模数是8。sum_b是8的2倍,不需再次对齐。 
综上3步,可知结构体的长度是16B,各数据成员在内存中的分布如图1-1所示。 

在Linux中计算步骤如下: 
步骤1:所有数据成员自身长度和:1B + 12B = 13B --> sum_a = 13B 
步骤2:数据成员a放在相对偏移0处,之前不需要填充字节;数据成员b为了内存对齐,根据“结构体大小的计算方法和步骤”中第二条原则,其对齐模数是4,之前需填充3个字节,sum_a + 3 = 16B --> sum_b = 16 B 
步骤3:按照定义,结构体对齐模数是结构体内部最大数据成员长度和pragma pack中较小者,前者为12后者为4,所以结构体对齐模数是4。sum_b是4的4倍,不需再次对齐。 
综上3步,可知结构体的长度是16B,各数据成员在内存中的分布如图1-2所示。 

1-1 

例子2:

#pragma pack(2) struct my_struct {     char a;     long double b; }; #pragma pack()

例子1和例子2不同之处在于例子2中使用了#pragma pack(2)编译参数,它强制指定对齐模数是2。此例子Windows和Linux计算方法有些许不一致。 

在Windows中计算步骤如下: 
步骤1:所有数据成员自身长度和:1B + 8B = 13B --> sum_a = 9B 
步骤2:数据成员a放在相对偏移0处,之前不需要填充字节;数据成员b为了内存对齐,根据“结构体大小的计算方法和步骤”中第二条原则,其对齐模数是2,之前需填充1个字节,sum_a + 1 = 10B --> sum_b = 10 B 
步骤3:按照定义,结构体对齐模数是结构体内部最大数据成员长度和pragma pack中较小者,前者为8后者为2,所以结构体对齐模数是2。sum_b是2的5倍,不需再次对齐。 
综上3步,可知结构体的长度是10B,各数据成员在内存中的分布如图2-1所示。 

在Linux中计算步骤如下: 
步骤1:所有数据成员自身长度和:1B + 12B = 13B --> sum_a = 13B 
步骤2:数据成员a放在相对偏移0处,之前不需要填充字节;数据成员b为了内存对齐,根据“结构体大小的计算方法和步骤”中第二条原则,其对齐模数是2,之前需填充1个字节,sum_a + 1 = 14B --> sum_b = 14 B 
步骤3:按照定义,结构体对齐模数是结构体内部最大数据成员长度和pragma pack中较小者,前者为8后者为2,所以结构体对齐模数是2。sum_b是2的7倍,不需再次对齐。 
综上3步,可知结构体的长度是14B,各数据成员在内存中的分布如图2-2所示。 

2 

例子3:

struct my_struct {     char a;     double b;     char c; }; 

前两例中,数据成员在Linux和Windows下都相同,例3中double的对齐模数在Linux中是4,在Windows下是8,针对这种模数不相同的情况加以分析。 
在Windows中计算步骤如下: 
步骤1:所有数据成员自身长度和:1B + 8B + 1B = 10B --> sum_a = 10B 
步骤2:数据成员a放在相对偏移0处,之前不需要填充字节;数据成员b为了内存对齐,根据“结构体大小的计算方法和步骤”中第二条原则,其对齐模数是8,之前需填充7个字节,sum_a + 7 = 17B --> sum_b = 17B 
步骤3:结构体对齐模数是结构体内部最大数据成员长度,此处者为8所以结构体对齐模数是8。所以结构体对齐模数是8。sum_b应该是8的整数倍,所以要在结构体后填充8*3 - 17 = 7个字节。 
综上3步,可知结构体的长度是24B,各数据成员在内存中的分布如图3-1所示。 

在Linux中计算步骤如下: 
步骤1:所有数据成员自身长度和:1B + 8B + 1B = 10B,sum_a = 10B 
步骤2:数据成员a放在相对偏移0处,之前不需要填充字节;数据成员b为了内存对齐,根据“结构体大小的计算方法和步骤”中第二条原则,其对齐模数是4,之前需填充3个字节,sum_b = sum_a + 3 = 13B 
步骤3:按照定义,结构体对齐模数是结构体内部最大数据成员长度和pragma 
pack中较小者,前者为8后者为4,所以结构体对齐模数是4。sum_b应该是4的整数倍,所以要在结构体后填充4*4 - 13 = 3个字节。 
综上3步,可知结构体的长度是16B,各数据成员在内存中的分布如图3-2所示。 

3 

例子4:

struct my_struct {     char a[11];     int b;     char c; }; 

此例子Windows和Linux计算方法一样,如下: 
步骤1:所有数据成员自身长度和:11B + 4B + 1B = 16B --> sum_a = 16B 
步骤2:数据成员a放在相对偏移0处,之前不需要填充字节;数据成员b为了内存对齐,根据“结构体大小的计算方法和步骤”中第二条原则,其对齐模数是4(最大的是int b,为4,不是11),之前需填充1个字节,sum_a + 1 = 17B --> sum_b = 17B 
步骤3:结构体对齐模数是结构体内部最大数据成员长度,此处者为4,所以结构体对齐模数是4。所以结构体对齐模数是4。sum_b是4的整数倍,需在结构体后填充4*5 - 17 = ,3个字节。 
综上3步,可知结构体的长度是20B,各数据成员在内存中的分布如图4所示。 

4 

例子5:

struct my_test {     int my_test_a;     char my_test_b; }; struct my_struct {     struct my_test a;     double my_struct_a;     int my_struct_b;     char my_struct_c; }; 

例子5和前几个例子均不同,在此例子中我们要计算struct my_struct的大小,而my_struct中嵌套了一个my_test结构体。这种结构体应该如何计算呢?原则是将my_test在my_struct中先展开,然后再计算,即是展开成如下结构体:

struct my_struct{    int my_test_a;    char my_test_b;    double my_struct_a;    int my_struct_b;    char my_struct_c;}; 

此例子Windows中的计算方法如下: 
步骤1:所有数据成员自身长度和:4B + 1B + 8B + 4B + 1B= 18B --> sum_a = 18B 
步骤2:数据成员my_struct_a为了内存对齐,根据“结构体大小的计算方法和步骤”中第二条原则,其对齐模数是8,之前需填充3个字节:sum_a + 3 = 21B --> sum_b = 21B 
步骤3:结构体对齐模数是结构体内部最大数据成员长度,此处者为8所以结构体对齐模数是8。所以结构体对齐模数是8。sum_b是8的整数倍,需在结构体后填充3*8 - 21 = 3个字节。 
综上3步,可知结构体的长度是24B,各数据成员在内存中的分布如图5所示。 

此例子Linux中的计算方法如下: 
步骤1:所有数据成员自身长度和:4B + 1B + 8B + 4B + 1B= 18B,sum_a = 18B 
步骤2:数据成员my_struct_a为了内存对齐,根据“结构体大小的计算方法和步骤”中第二条原则,其对齐模数是4,之前需填充3个字节,sum_b = sum_a + 3 = 21B 
步骤3:按照定义,结构体对齐模数是结构体内部最大数据成员长度和pragma 
pack中较小者,前者为4后者为4,所以结构体对齐模数是4。sum_b是4的整数倍,需在结构体后填充6*4 - 21 = 3个字节。 
综上3步,可知结构体的长度是24B,各数据成员在内存中的分布如图5所示。 

5

5 -- 源代码附录

上面的例子均在Windows(VC++6.0)和Linux(GCC4.1.0)上测试验证。下面是测试程序。

#include <iostream>#include <stdio.h>using namespace std;int main(){    cout << "sizeof(char)        = " << sizeof(char) << endl;    cout << "sizeof(short)       = " << sizeof(short) << endl;    cout << "sizeof(int)         = " << sizeof(int) << endl;    cout << "sizeof(long)        = " << sizeof(long) << endl;    cout << "sizeof(float)       = " << sizeof(float) << endl;    cout << "sizeof(double)      = " << sizeof(double) << endl;    cout << "sizeof(long long)   = " << sizeof(long long) << endl;    cout << "sizeof(long double) = " << sizeof(long double) << endl << endl;        // 例子1    {        struct my_struct         {             char a;             long double b;         };        cout << "exapmle-1: sizeof(my_struct) = " << sizeof(my_struct) << endl;          struct my_struct data;         printf("my_struct->a: %u\nmy_struct->b: %u\n\n", &data.a, &data.b);    }    // 例子2    {        #pragma pack(2)         struct my_struct         {             char a;             long double b;         };                 #pragma pack()        struct my_struct data;         cout << "exapmle-2: sizeof(my_struct) = " << sizeof(my_struct) << endl;          printf("my_struct->a: %u\nmy_struct->b: %u\n\n", &data.a, &data.b);    }        // 例子3    {        struct my_struct         {             char a;             double b;             char c;         };          struct my_struct data;         cout << "exapmle-3: sizeof(my_struct) = " << sizeof(my_struct) << endl;          printf("my_struct->a: %u\nmy_struct->b: %u\nmy_struct->c: %u\n\n", &data.a, &data.b, &data.c);    }    // 例子4    {        struct my_struct         {              char a[11];              int b;              char c;          };          cout << "example-4: sizeof(my_struct) = " << sizeof(struct my_struct) << endl;          struct my_struct data;        printf("my_struct->a: %u\nmy_struct->b: %u\nmy_struct->c: %u\n\n", &data, &data.b, &data.c);    }    // 例子5     {        struct my_test         {             int my_test_a;             char my_test_b;         };                 struct my_struct         {             struct my_test a;             double my_struct_a;             int my_struct_b;             char my_struct_c;         };         cout << "example-5: sizeof(my_struct) = " << sizeof(struct my_struct) << endl;          struct my_struct data;        printf("my_struct->my_test_a  : %u\n"            "my_struct->my_test_b  : %u\n"            "my_struct->my_struct_a: %u\n"            "my_struct->my_struct_b: %u\n"            "my_struct->my_struct_c: %u\n", &data.a.my_test_a, &data.a.my_test_b,             &data.my_struct_a, &data.my_struct_b, &data.my_struct_c);    }    return 0;}
执行结果: 
//Linux localhost 3.4.6-2.10-desktop #1 SMP PREEMPT Thu Jul 28 19:20:26 UTC 2012 (641c197) x86_64 x86_64 x86_64 GNU/Linuxsizeof(char)        = 1sizeof(short)       = 2sizeof(int)         = 4sizeof(long)        = 8sizeof(float)       = 4sizeof(double)      = 8sizeof(long long)   = 8sizeof(long double) = 16exapmle-1: sizeof(my_struct) = 32my_struct->a: 2163695552my_struct->b: 2163695568exapmle-2: sizeof(my_struct) = 18my_struct->a: 2163695680my_struct->b: 2163695682exapmle-3: sizeof(my_struct) = 24my_struct->a: 2163695648my_struct->b: 2163695656my_struct->c: 2163695664example-4: sizeof(my_struct) = 20my_struct->a: 2163695616my_struct->b: 2163695628my_struct->c: 2163695632example-5: sizeof(my_struct) = 24my_struct->my_test_a  : 2163695584my_struct->my_test_b  : 2163695588my_struct->my_struct_a: 2163695592my_struct->my_struct_b: 2163695600my_struct->my_struct_c: 2163695604

//Linux localhost 3.4.6-2.10-desktop #1 SMP PREEMPT Thu Jul 26 09:36:26 UTC 2012 (641c197) i686 i686 i386 GNU/Linuxsizeof(char)        = 1sizeof(short)       = 2sizeof(int)         = 4sizeof(long)        = 4sizeof(float)       = 4sizeof(double)      = 8sizeof(long long)   = 8sizeof(long double) = 12exapmle-1: sizeof(my_struct) = 16my_struct->a: 3213889904my_struct->b: 3213889908exapmle-2: sizeof(my_struct) = 14my_struct->a: 3213889890my_struct->b: 3213889892exapmle-3: sizeof(my_struct) = 16my_struct->a: 3213889872my_struct->b: 3213889876my_struct->c: 3213889884example-4: sizeof(my_struct) = 20my_struct->a: 3213889852my_struct->b: 3213889864my_struct->c: 3213889868example-5: sizeof(my_struct) = 24my_struct->my_test_a  : 3213889828my_struct->my_test_b  : 3213889832my_struct->my_struct_a: 3213889836my_struct->my_struct_b: 3213889844my_struct->my_struct_c: 3213889848

//CYGWIN_NT-6.1 motadou-PC 1.7.20(0.266/5/3) 2013-06-07 11:11 i686 Cygwinsizeof(char)        = 1sizeof(short)       = 2sizeof(int)         = 4sizeof(long)        = 4sizeof(float)       = 4sizeof(double)      = 8sizeof(long long)   = 8sizeof(long double) = 12exapmle-1: sizeof(my_struct) = 16my_struct->a: 2272336my_struct->b: 2272340exapmle-2: sizeof(my_struct) = 14my_struct->a: 2272322my_struct->b: 2272324exapmle-3: sizeof(my_struct) = 24my_struct->a: 2272296my_struct->b: 2272304my_struct->c: 2272312example-4: sizeof(my_struct) = 20my_struct->a: 2272276my_struct->b: 2272288my_struct->c: 2272292example-5: sizeof(my_struct) = 24my_struct->my_test_a  : 2272248my_struct->my_test_b  : 2272252my_struct->my_struct_a: 2272256my_struct->my_struct_b: 2272264my_struct->my_struct_c: 2272268
分类: com.language.c
好文要顶 关注我 收藏该文  
酱油和醋
关注 - 2
粉丝 - 27
+加关注
9
1
(请您对文章做出评价)
« 上一篇:中断向量表
» 下一篇:大端法、小端法、网络字节序
posted @ 2009-01-17 16:56 酱油和醋 阅读(21971) 评论(9) 编辑 收藏

  
#1楼 2011-05-13 09:50 dragon86  
对齐模数是#pragma pack指定的数值以及该数据成员自身长度中数值较小者
这里是较大者吧?我看例子1那里,#pragma pack是4,数据成员中有1和8,你取8作为对齐模数的啊!
支持(3)反对(0)
  
#2楼 2011-05-13 10:26 dragon86  
例子3中的步聚2没有谈到成员c的对齐,感觉好像为了省事都是复制粘贴,最明显的证据就是例子2中1B + 8B = 13B。我已经很耐心的看了,但实在看不下去了。
支持(1)反对(0)
  
#3楼 2012-04-21 10:33 aitao  
1楼没有认真阅读开始的那张表
支持(0)反对(1)
  
#4楼 2012-09-08 10:36 登上  
struct my_struct
{
int my_test_a;
char my_test_b;
double my_struct_a;
int my_struct_b;
char my_struct_c;
}; 例子5,应该不是简单的把嵌套结构体合并,而是把这个
struct my_test 

int my_test_a; 
char my_test_b; 
}; 看成一个整体去看待!这篇文章写的很好,分析的非常的全面,我顶!
支持(0)反对(1)
  
#5楼 2012-10-01 21:53 Paul_bai  
太酷了
支持(0)反对(0)
  
#6楼 2014-06-27 13:51 见贤思齐River  
楼主,我经过验证,在Linux下,例3的长度为24。
支持(1)反对(0)
  
#7楼 2015-07-12 17:41 C#Sharp  
@ aitao
特地注册账号来评论一些错误:
1.windows上面pragma pack的默认大小不是所谓的【32位系统为4字节,64位为8字节】而是 等于最大的内置类型长度大小,所以你会发现【 例子1】中的pragma pack不应该是4,而应该是8(否则,你怎么解释例子3的pragma pack却是8了)
支持(2)反对(0)
  
#8楼 2016-03-03 10:03 道慧-道道都会  
666
支持(0)反对(0)
  
#9楼 2016-04-11 11:36 Jason‘  
例子1 好像错了,明明long double为12 为什么要说成8 呢?
支持(0)反对(0)
刷新评论刷新页面返回顶部
【推荐】50万行VC++源码: 大型组态工控、电力仿真CAD与GIS源码库
【推荐】融云即时通讯云-豆果美食、Faceu等亿级APP都在用
最新IT新闻:
· Google准备测试能抵抗量子计算机破解的加密算法
· 甲骨文公司承诺继续支持Java EE
· 《口袋怪兽Go》开发者揭秘如何打造这款游戏
· 谷歌开始在印度培训200万Android平台开发者
· 高通正式发布骁龙821处理器 性能最高提升10%
» 更多新闻...
最新知识库文章:
· 编程的智慧
· 写给初学前端工程师的一封信
· 抽象:程序员必备的能力
· 编程同写作,写代码只是在码字
· 遇见程序员男友
» 更多知识库文章...
0 0
原创粉丝点击