钻石型继承模型的内存分布

来源:互联网 发布:知乎洗头发顺序 编辑:程序博客网 时间:2024/04/26 03:04

转自:点击打开链接 和点击打开链接 并更正一个小错误以及增加了自己的一些理解

关于C++对象内存布局的资料和书籍也有很多,比如陈皓老师的博客:

1、C++对象的内存布局(上)

2、C++对象的内存布局(下)

白杨:

RTTI、虚函数和虚基类的实现方式、开销分析及使用指导

左手为你画猜:

C++类对象内存模型与成员函数调用分析(上、中、下)

关于讲解C++对象内存模型最好的书应该是侯捷老师翻译的《深度探索C++对象内存模型》。

这两天在看其他书籍时,对C++中虚拟继承的实现机制不太理解,于是又重新翻回《深度探索C++对象内存模型》一书,并结合C++对象的内存布局(下)一文。在Visual Studio 2010下用“cl”编译器进行测试,查看虚拟多重继承下的C++对象内存模型。总结如下:

一、重复继承

所谓重复继承,即某个基类被间接地重复继承了多次。为方便对比说明,下面的代码采用了陈皓老师博客中C++类例子。

UML类图如下:

类继承的源代码如下,直接采用C++对象的内存布局(下)中的例子,相关解释已在原博客中详细说明,故在此不再赘述:

复制代码
 1 #include <iostream> 2 using namespace std; 3  4 class B 5 { 6 public: 7     int ib; 8     char cb; 9 public:10     B():ib(0),cb('B')11     {}12     virtual void f()13     {14         cout<<"B::f()"<<endl;15     }16     virtual void Bf()17     {18         cout<<"B::Bf()"<<endl;19     }20 };21 22 class B1:public B23 {24 public:25     int ib1;26     char cb1;27 public:28     B1():ib1(01),cb1('1'){}29 30     virtual void f()31     {32         cout<<"B1::f()"<<endl;33     }34     virtual void f1()35     {36         cout<<"B1::f1()"<<endl;37     }38     virtual void Bf1()39     {40         cout<<"B1::Bf1()"<<endl;41     }42 };43 44 class B2:public B45 {46 public:47     int ib2;48     char cb2;49 public:50     B2():ib2(10),cb2('2'){}51     virtual void f()52     {53         cout<<"B2::f()"<<endl;54     }55     virtual void f2()56     {57         cout<<"B2::f2()"<<endl;58     }59     virtual void Bf2()60     {61         cout<<"B2::Bf2()"<<endl;62     }63 };64 65 class D: public B1, public B266 {67 public:68     int id;69     char cd;70 public:71     D():id(100),cd('D'){}72 73     virtual void f()74     {75         cout<<"D::f()"<<endl;76     }77     virtual void f1()78     {79         cout<<"D::f1()"<<endl;80     }81     virtual void f2()82     {83         cout<<"D::f2()"<<endl;84     }85     virtual void Df()86     {87         cout<<"D::Df()"<<endl;88     }89 90 };91 int main(int argc, char *argv[])92 {93     D d;94     system("pause");95     return 0;96 }
复制代码

在陈皓老师博客中,直接利用函数指针调用C++对象起始位置处虚函数表指针指向的虚函数表中的虚函数,以查看C++对象的内存模型。下面我们主要采用Visual Studio 2010 和 Visual C++下的“cl”编译器查看C++对象内存模型。

Visual Studio 2010 IDE开发环境中,我们查看派生类D对象的内存模型。如下图所示:

  

从上两图我们可以基本看出:

1、派生类D对象d的内存布局中,由其基类依次组装而成,再加上派生类自己的成员变量。

2、其中基类布局依次按照在派生类中的声明顺序排列。

3、每个基类都有自己的虚函数表,指向虚函数表的指针_vfptr放置在最前面的位置。

为了再进一步了解重复继承中的C++对象内存模型,我们采用Visual C++下的“cl”编译器进行查看。

在“Microsoft Visual C++”的编译环境中,我们可以利用编译器“cl”、链接器“link”、可执行文件查看器“dumpbin”来查看Windows下可执行文件(COFF格式)的变量、函数怎么存储。

“cl”即Visual C++ 的编译器,即“Compiler”的缩写。在Visual Studio 2010安装完后,会有一个批处理文件用来建立运行这些工具所需要的环境。它位于开始/程序/Microsoft Visual Studio 2010/Visual Studio Tools/Viusual Studio 2010 Command Prompt,这样我们就可以利用命令行使用VC++的编译器了。

在“cl”编译器中有个编译选项可以查看C++类的内存布局,使用如下:打开Visual Studio的命令行提示符即Viusual Studio 2010 Command Prompt,按如下格式输入:

>cl [.cpp] /d1reportSingleClassLayout[classname]

d1reportSingleClassLayout可以查看源文件中所有类及结构体的内存布局,classname为类名,/d1reportSingleClassLayout[classname]之间没有空格。使用如下图所示:

使用cl编译器查看重复继承中的C++对象内存模型结果如下图所示:

 从上图可以看出,编译器在实现时使用了字节对齐(Alignment),以实现在对象内存中存取更有效率。字节对齐就是将数值调整到某数的整数倍,在32位计算机中,通常Alignment为4bytes,以使bus的“运输量”达到最高效率。

可以看出,派生类D对象在内存中占有44个字节。

 重复继承中的C++对象内部模型用图片表示如下:

其中第一个vfptr指向的虚表是B1和D共享的,因此其中的函数接口应该覆盖了B1和D,而第二个则只有B2的虚表。

从图中可以看出,在派生类D中,存在着两份基类B的成员实例,分别为ib和cb,所以在C++对象的内存布局(下)指出这样可能会出现二义性编译错误。我们可以指定类作用域符::进行限定来消除二义性,也可以在语言层面利用虚拟继承机制来解决。

二、钻石型多重虚拟继承

 在《深度探索C++对象模型》中提到:一个virtual base class subobject只会在derived class中存在一份实体,不管它在class继承体系中出现多少次!

因此,虚拟继承的就是为了解决重复继承中多个间接父类的问题。钻石型的结构就是最经典的虚拟多重继承结构。

UML类图如下:

 

 

如上图,让B1和B2各自维护的一个B子对象,折叠成一个由D维护的单一的B子对象,并且还可以保存基类和派生类的指针之间的多态指定操作,这对于编译器实现来说,难度非常高。《深度探索C++对象模型》提到一般的实现方法如下所述:将D对象分割为两部分,一个不变局部和一个共享局部。不变局部中的数据,不管后继如何衍化,总是拥有固定的偏移量,所以这一部分数据可以被直接存取,至于共享局部,所表现的就是虚拟继承的基类子对象,这一部分的数据,其位置会因为每次的派生操作而有变化,所以它们是间接存取。

所以,一般的布局策略是安排好派生类对象的不变部分,然后再建立其共享部分。在接下来的分析可以看出,VC++编译器实现中,在每一个派生类对象中插入一些指针vbptr,每个指针指向一个虚拟继承的基类子对象。要存取继承得来的基类子对象,可以使用相关指针间接完成。

要实现虚拟继承,我们只需要在B1和B2继承B的语法中加入virtual关键字即可。实现代码如下:

 

 View Code

 

使用cl编译器查看钻石型虚拟重复继承中的C++对象内存模型结果如下图所示:

 

 

从上图可以看出,虚拟重复继承中的派生类D对象在内存中占有52字节,比之前多了8个字节。

 虚拟重复继承中的C++对象内部模型用图片表示如下:


 

注意和非虚多重继承不同的是,第一个虚表只记录了B1(不包括B)和D的函数接口,B的函数接口在最后的基类虚表中,另外B1和B2部分各有一个vbptr。

从图中可以看出,VC++编译器在实现虚拟继承时,在派生类的对象中安插了两个vbptr指针。因此,对每个继承自虚基类的类实例,将增加一个隐藏的“虚基类表指针”(vbptr)成员变量,从而达到间接计算虚基类位置的目的。该变量指向一个全类共享的偏移量表,表中项目记录了对于该类而言,“虚基类表指针”与虚基类之间的偏移量。由上可以看出,B1虚基类表指针vbptr与虚基类B之间的偏移量是40字节,B2虚基类表指针vbptr与虚基类B之间的偏移量是24字节。第一项中-4的含义:表示的是vptr和vbptr的距离,如果B1中没有虚函数的定义,这个地方就会是0。vbptr就是存放在vptr下面的位置。

我们注意到在虚拟继承的C++对象内存布局中,还有一个4个字节的vtordisp字段,vtordisp在MSDN中这样解释:

Enables the addition of the hidden vtordisp construction/destruction displacement member. The vtordisp pragma is applicable only to code that uses virtual bases. If a derived class overrides a virtual function that it inherits from a virtual base class, and if a constructor or destructor for the derived class calls that function using a pointer to the virtual base class, the compiler may introduce additional hidden “vtordisp” fields into classes with virtual bases.

也就是说如果虚拟继承中派生类重写了基类的虚函数,并且在构造函数或者析构函数中使用指向基类的指针调用了该函数,编译器会为虚基类添加vtordisp域
#include "stdafx.h"#include <iostream>  using namespace std;class Point{public:Point(int x = 1, int y = 1) :_x(x), _y(y){}virtual void print(){ cout << "This is Point. "; }protected:int _x, _y;};class Point3d :virtual public Point{public:Point3d() :_z(2){}void print(){ cout << "This is Point3d. "; }protected:int _z;};int main(){Point3d d;int *p = (int *)&d;p++;cout << *p << endl;//输出_z的值2  p++;cout << *p << endl; //输出vtordisp的值,这里为0  p++;cout << *p << endl; //输出vptr的值  p++;cout << *p << endl;//输出_x的值 1  p++;cout << *p << endl; //输出_y的值1  cout << sizeof(Point3d) << endl; //大小为24  system("pause");return 0;}
首先注意虚继承的基类部分在底部,另外Point3d没有新的虚函数,而是只有一个重写了基类的print,因此不会在顶部生成一个vfptr,print接口在底部的基类vfptr中,于是p++跳过的是vbptr,则是成员变量z,再p++就是vtordisp。如果Point3d再增加一个新的虚函数,则会导致Point3d大小变为28,且需要两次p++才能定位到z,多了一个属于派生类Point3d自己的vfptr。
上面说明:vs2010中虚拟继承中只要派生类重写了基类的虚函数(一旦重写就可能使用基类的虚函数),并且派生类有显式声明的构造函数(会认为它可能会调用基类的虚函数),此时vtordisp域就会被添加,若去掉显式声明,让编译器生成默认构造函数,则一定不会在构造函数/析构函数中使用基类的虚函数,因此则不会生成vtordisp域。当然这个域还可以手动关闭(注意:一定是确保在构造函数和析构函数中不会使用基类的虚函数):
#pragma vtordisp( off )class GetReal : virtual public { ... };#pragma vtordisp( on )

这个程序在VC++坏境是这样的输出结果,通过g++编译后,在g++中输出结果是不一样的,区别在于各个类的大小。这与编译器记录虚拟继承的方式有关VC++通过记录偏移量的方式来找到虚拟基类的位置。所以在类中偏移量占据一定字节。g++将偏移量记录在虚函数表中,在虚函数表中偏移量为正则存放的是虚函数地址;偏移量为负存放的是虚拟基类的偏移量所以g++上虚拟继承下的类的大小比VC++编译的程序要小。

即vs2010中,满足:1. 虚继承;2. 派生类重写了父类虚函数;3. 构造/析构函数中可能调用基类的虚函数(例如有显式定义的构造函数)

钻石继承模型中的vtordisp域
在钻石继承模型中,vtordisp只会出现一次,即在基类部分的顶部。例如有如下代码:
class B{public:virtual void fooB(){}virtual void funcB(){}int mB=0;};class B1 :public virtual B{public:B1() :mB1(1){}void fooB(){}virtual void fooB1(){}int mB1;};class B2 :public virtual B{public:B2() :mB2(2){}void funcB(){}virtual void fooB2(){}int mB2;};class D :public B1, B2{D() :mD(3){ }virtual void fooD(){}int mD;};
则此时内存模型为:

若将其中派生类的重写或者构造函数全部注释掉,则会出现如下情况,vtordisp域不再生成。

注意:vtordisp域的生成只看派生类(包括D)是否对虚基类(B)的虚函数有重写,并且有显式构造/析构函数(可能调用虚函数),例如如下代码:
class B{public:virtual void fooB(){}virtual void funcB(){}int mB=0;};class B1 :public virtual B{public://B1() :mB1(1){}void fooB(){}virtual void fooB1(){}int mB1;};class B2 :public virtual B{public://B2() :mB2(2){}void funcB(){}virtual void fooB2(){}int mB2;};class D :public B1, B2{D() :mD(3){ }void fooB(){}virtual void fooD(){}int mD;};
仍然会生成vtordisp:
按照前边的资料内容,这个字段和编译选项/vd相关。/vd被称为构造置换(具体什么意思,我也不太清楚,惭愧!),它所解决的问题是:由于对类的虚拟基的置换与对其派生类的置换之间有差异,可能会向虚函数传递错误的 this 指针。 该解决方案向类的各个虚拟基提供称作 vtordisp 字段的单个构造置换调整。但是如何构造产生错误this指针的测试用例,请恕作者才疏学浅不能给出,也希望看到此文的大牛们给出测试用例。

0 0
原创粉丝点击