多态实现机制

来源：互联网发布：java 去除转义字符编辑：程序博客网时间：2024/06/10 23:18

有趣的问题

考虑下面的 C++ 程序：

?
Code Sample01
02
03
04
05
06
07
08
09
10
11
12
13
14
15
classA
{
     voidfunc(){}
};
 
classB:public A
{
      voidfunc(){}
};
 
int main(void)
{
     cout <<sizeof(A) <<" " << sizeof(B) << endl;
     return0;
}

输出结果是：1 1

再考虑下面很相似的程序：

?
Code Sample01
02
03
04
05
06
07
08
09
10
11
12
13
14
15
classA
{
     virtualvoid funcA(){}
};
 
classB:public A
{
     virtualvoid funcB(){}
};
 
int main(void)
{
     cout <<sizeof(A) <<" " << sizeof(B) << endl;
     return0;
}

输出结果是：4 4

再来考虑下面的形似的程序：

?
Code Sample01
02
03
04
05
06
07
08
09
10
11
12
13
14
15
classA
{
     virtualvoid funcA(){}
};
 
classB:virtual public A
{
     virtualvoid funcB(){}
};
 
int main(void)
{
     cout <<sizeof(A) <<" " << sizeof(B) << endl;
     return0;
}

输出结果是：4 12

对于第一种情况，没有出现虚函数，也无任何成员变量，因此是一个空类，空类理论上可以进行实例化，每个实例在内存中都有独一无二的地址来标明，所以会占用 1B 的空间，无可厚非。

但第二种情况和第三种情况加入了虚函数（virtual function），而且在第三种情况当中，引入了虚基类（virtual base class）的概念，所得到的结果大相径庭，这是 C++ 引入了 virtual function 和 virtual base class，即多态，更形象的解释是「以一个 public base class 的指针或者引用，寻址出一个 derived class object」，但多态带了一定空间上的开销，在效率上也有折损。

其实, 多态机制可以归结为下面三这句话:

一般而言, 我们无法知道指针 ptr 所指的对象的真正类型. 但经由 ptr 总是可以存取到对象的 virtual table.
虚函数 fn() 总是放在 virtual table 中的固定位置, 用一个固定的索引值就可以 fetch 到.
唯一一个执行期需要知道的是 ptr 所指的对象.

下面是 C++ 多态机制实现详解.

从最简单的对象模块开始

最为简单的对象模型：

静态/非静态成员函数和静态/非静态成员变量的地址都存储在一个表当中，通过表内存储的地址指向相应的部分。这样的设计简易，便于理解，类的实例只需要维护这张表就好了，赔上的是空间和执行效率：

空间上：没必要为每一个实例都存储静态成员变量和成员函数

效率上：每次执行实例的一个成员函数都要在表内进行搜索

这是最初的假设，实际的实现肯定没有那么简单，下面是将变量和函数分割存储的模型（表格驱动对象模型）：

Image(1)

简易对象模型经改良后可以的得到这种。sizeof(A) 的结果是 8。

为支撑 virtual function ，引入了现在的 C++ 对象模型：

Image(2)

非静态成员变量同指向虚拟函数表的指针（vptr），和静态成员变量/函数，非静态成员函数分离存储。类的每一个实例都存有 vptr 和非静态成员函数，他们独立拥有这些数据，并不和其他的实例共享。这时候，回到第二种情况，class A 和继承自 A 的 class B 都拥有虚函数，因此都会有一个 vptr，因此 sizeof 运算得到的结果都为 4.然而，如果往里面添加一个非静态 int 型变量，那么相应可以得到 8B 的大小；但往里面添加静态 int 型变量，大小却没有改变。

单一继承

下面是单一继承里经常看到的一个程序：

?
Code Sample01
02
03
04
05
06
07
08
09
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
classA
{
public:
    inta;
    voidfoo(){}
    virtualvoid funcA(){}
    virtualvoid func()
    {cout <<"class A's func." << endl;}
};
 
classB : publicA
{
public:
    intb;
    voidfoo(){}
    virtualvoid funcB(){}
    virtualvoid func()
    {cout <<"class B's func." << endl;}
};
 
int main(void)
{
    A *pa = newB;
    pa->func();
}

输出结果是：class B’sfunc.

多态就是多种状态，一个事物可能有多种表现形式，譬如动物，有十二生肖甚至更多的表现形式。当基类里实现了某个虚函数，但派生类没有实现，那么类 B 的实例里的虚函数表中放置的就是 &A::func。此外，派生类也实现了虚函数，那么类 B 实例里的虚函数表中放置的就是 B::func。A *pa = new B; 因为 B 实现了 func，那么它被放入 A 实例的虚拟函数表中，从而代替 A 实例本身的虚拟函数。pa->func(); 调用的结果就不稀奇了，这是虚函数机制带来的。

class A 和 class B 的内存布局和 vptr 可能是下面的样子：

———-
| int a |
———-
| vptr | ——–>| &A::funcA()
———- ————————————————-
| &A::func()
————————————————-

———-
| int a |
———-
| vptr | ——–>| &A::funcA() 依旧是 A 的虚函数
———- ————————————————-
| int b | | &B::func() A::func()
———- ————————————————-
| &B::funcB()
————————————————-

倘若虚函数以外的就没有「多态」效果了，除非进行强制类型转换：

pa->a; // 成功，因为 pa 的类型就是 A
pa->b; // 失败，因为 B::b
pa->funcB(); // 失败，因为B::funcB() 不是虚函数
pa->funcA(); // 成功，因为A::funcA()

总结一下：

当引入虚函数的时候，会添加 vptr 和其指向的一个虚拟函数表从而增加额外的空间，这些信息在编译期间就已经确定，而且在执行期不会插足修改任何内容。
在类的构造和析构函数当中添加对应的代码，从而能够为 vptr 设定初值或者调整 vptr，这些动作由编译器完成，class 会产生膨胀。
当出现继承关系时，虚拟函数表可能需要改写，即当用基类的指针指向一个派生类的实体地址，然后通过这个指针来调用虚函数。这里要分两种情况，当派生类已经改写同名虚函数时，那么此时调用的结果是派生类的实现；而如果派生类没有实现，那么调用依然是基类的虚函数实现，而且仅仅在多态仅仅在虚函数上表现。
多态仅仅在虚函数上表现，意即倘若同样用基类的指针指向一个派生类的实体地址，那么这个指针将不能访问和调用派生类的成员变量和成员函数。
所谓执行期确定的东西，就是基类指针所指向的实体地址是什么类型了，这是唯一执行期确定的。以上是单一继承的情况，在多重继承的情况会更为复杂。

多重继承

下面是少有看到的程序代码：

?
Code Sample01
02
03
04
05
06
07
08
09
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
classA
{
public:
    virtual~A(){cout << "A destruction"<< endl;}
    inta;
    voidfooA(){}
    virtualvoid func(){cout <<"A func." << endl;};
    virtualvoid funcA(){cout <<"funcA." << endl;}
};
 
classB
{
public:
    virtual~B(){cout << "B destruction"<< endl;}
    intb;
    voidfooB(){}
    virtualvoid func(){cout <<"B func." << endl;};
    virtualvoid funcB(){cout <<"funcB." << endl;}
};
 
classC : public A,public B
{
public:
    virtual~C(){cout << "C destruction"<< endl;}
    intc;
    voidfooC(){}
    virtualvoid func(){cout <<"C func." << endl;};
    virtualvoid funcC(){cout <<"funcC." << endl;}
};
 
int main(void) 
{  
    return0;
}

当用基类的指针指向一个派生类的实体地址，基类有两种情况，一种是 class A 和 class B，如果是 A，问题容易解决，几乎和上面单一继承情况类似；但倘若是 B，要做地址上的转换，情况会比前者复杂。先展现class A，B，C 的内存布局和 vptr：

———-
| int a |
———-
| vptr | ——–>| &A::~A()
———- ————————————————-
| &A::func()
————————————————-
| &A::funcA()
————————————————-

———-
| int b |
———-
| vptr | ——–>| &B::~B()
———- ————————————————-
| &B::func()
————————————————-
| &B::funcB()
————————————————–

| &C::~C() &A::~A()
———- ————————————————-
| int a | | &C::func() &A::func()
———- ————————————————-
———- | &C::funcC()
| vptr | ——–>————————————————-
———- | &A::funcA()
———- ————————————————-
| int b | | &B::funcB() 跳
———- ————————————————-
———-
| vptr | ——–>| &C::~C() &B::~B() 跳
———- ————————————————-
| int c | | &C::func() &B::func() 跳
———- ————————————————-
| &B::funcB()
————————————————–

多重继承中，会有保留两个虚拟函数表，一个是与 A 共享的，一个是与 B 相关的，他们都在原有的基础上进行了修改：

对于 A 的虚拟函数表：

覆盖派生类实现的同名虚函数，并用派生类实现的析构函数覆盖原有虚函数
添加了派生类独有的虚函数
添加了右端父类即 B 的独有虚函数，需跳转

对于 B 的虚拟函数表：

覆盖派生类实现的同名虚函数，并用派生类实现的析构函数覆盖原有虚函数，但需跳转

int main(void)
{
A *pa = new C;
B *pb = new C;
C *pc = new C;
pa->func();
pb->func();
pc->funcC();
delete pb;
delete pa;
delete pc;
}

输出结果是：

C func.
C func.
funcC.
C destruction
B destruction
A destruction
C destruction
B destruction
A destruction
C destruction
B destruction
A destruction

7 行和 8 行的行为有很大的区别，7 行的调用和上面的单一继承的情况类似，不赘述。8 行的 pb->func(); 中，pb 所指向的是上图第 9 行的位置，编译器已在内部做了转换，也就是 pa 和 pb 所指的位置不一样，pa 指向的是上图第 3 行的位置。接着需要注意的是，pb->func(); 调用时，在虚拟函数表中找到的地址需要再进行一次跳转，目标是 A 的虚拟函数表中的 &C::func()，然后才真正执行此函数。所以，上面的情况作了指针的调整。

那什么时候会出现跳，常见的有两种情况：

右端基类，对应上面的具体是 B，调用派生类虚拟函数，比如 pb->~C() 和 pb->func()
派生类调用右端基类的虚拟函数，比如 pc->funcB()

所以 delete pa; 和 delete pa; 的操作是不一样的，pb->funcB(); 和 pc->funcB(); 也不一样。

C++ 为实现多态引入虚函数机制，带来了空间和执行上的折损。

单一/多重继承的构造和析构

单一继承中，构造函数调用顺序是从上到下（单一继承），从左到右（多重继承），析构函数调用顺序反过来。在上一段程序中，

delete pa;
delete pb;
delete pc;

都自动调用了基类和派生类的析构函数，其中只有 delete pc; 涉及了虚拟函数机制。《Effective C++》中07条款中有这样一句话：当derived class 对象经由一个 base 指针被删除，而该对象带有一个 non-virtual 析构函数，其结果未有定义—实际执行时通常发生的是对象的 derived 成分未被销毁。

特地，写了下面的程序：

?
Code Sample01
02
03
04
05
06
07
08
09
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
classA
{
public:
    ~A(){cout <<"A destruction" << endl;}
    inta;
};
 
classB
{
public:
    ~B(){cout <<"B destruction" << endl;}
};
 
classC : public A,public B
{
public:
    ~C(){cout <<"C destruction" << endl;}
};
 
int main(void)
{
    A *pa =new C;
    B *pb =new C;
    C *pc =new C;
    deletepa;     // 没有问题
    deletepb;     // 出错
    deletepc;     // 没有问题
}

所说的「未定义」就在 delete pa; 和 delete pb; 体现出来。

强烈建议，在设计继承关系的时候，为每一个基类实现 virtual 析构函数。

回到开始的问题：

第一种情况是因为编译器安插了一个字节，为的是一个类的对象能再内存有独一无二的地址，无可厚非。
第二种情况是因为编译器安插了 vptr。
第三种情况是因为编译器除了安插 A 和 B 的 vptr 外，还有一个指向虚基类的指针。

另外，虚拟继承在应用比较少应用，一个例子就是：

?
Code Sample1
2
3
4
5
6
7
classios {...};
 
classistream : publicvirtual ios {...};
 
calss ostream : public virtualios {...};
 
classiostream : publicistream,publicostream {...};

这里 istream，ostream，iostream 共享同一份 ios。要和下面的情况区分开来：

Code Sample

classios {...};
 
classistream : publicios {...};
 
calss ostream : public ios {...};
 
classiostream : publicistream,publicostream {...};

0 0