关于C++中RTTI的编码实现

来源:互联网 发布:centos没有vim 编辑:程序博客网 时间:2024/06/05 03:06
 
关于C++RTTI的编码实现
摘要:

  RTTI(Run-Time Type Identification)是面向对象程序设计中一种重要的技术。现行的C++标准对RTTI已经有了明确的支持。不过在某些情况下出于特殊的开发需要,我们需要自己编码来实现。本文介绍了一些关于RTTI的基础知识及其原理和实现。
 
RTTI需求:

  和很多其他语言一样,C++是一种静态类型语言。其数据类型是在编译期就确定的,不能在运行时更改。然而由于面向对象程序设计中多态性的要求,C++中的指针或引用(Reference)本身的类型,可能与它实际代表(指向或引用)的类型并不一致。有时我们需要将一个多态指针转换为其实际指向对象的类型,就需要知道运行时的类型信息,这就产生了运行时类型识别的要求。
 
C++RTTI的支持:

  C++提供了两个关键字typeiddynamic_cast和一个type_info类来支持RTTI

  dynamic_cast操作符:它允许在运行时刻进行类型转换,从而使程序能够在一个类层次结构安全地转换类型。dynamic_cast提供了两种转换方式,把基类指针转换成派生类指针,或者把指向基类的左值转换成派生类的引用。见下例讲述:
void company::payroll(employee *pe)
{
     //对指针转换失败,dynamic_cast返回NULL
     if(programmer *pm=dynamic_cast(pe))// 把基类指针转换成派生类指针
     {
           pm->bonus();
     }
}
 
void company::payroll(employee &re)
{
     try{
           //对引用转换失败的话,则会以抛出异常来报告错误
           programmer &rm=dynamic_cast(re);// 把指向基类的左值转换成派生类的引用
           pm->bonus();
     }
     catch(std::bad_cast){
 
     }
}

  这里bonusprogrammer的成员函数,基类employee不具备这个特性。所以我们必须使用安全的由基类到派生类类型转换,识别出programmer指针。

  typeid操作符:它指出指针或引用指向的对象的实际派生类型。

  例如:
employee* pe=new manager;
typeid(*pe)==typeid(manager) //true

  typeid可以用于作用于各种类型名,对象和内置基本数据类型的实例、指针或者引用,当作用于指针和引用将返回它实际指向对象的类型信息。typeid的返回是type_info类型。

  type_info类:这个类的确切定义是与编译器实现相关的,下面是《C++ Primer》中给出的定义(参考资料[2]中谈到编译器必须提供的最小信息量)
class type_info {
private:
     type_info(const type_info&);
     type_info& operator=( const type_info& );
public:
     virtual ~type_info();
     int operator==( const type_info& ) const;
     int operator!=( const type_info& ) const;
     const char* name() const;
};
 
实现目标:

  实现的方案

  方案一:利用多态来取得指针或应用的实际类型信息

 
using namespace std;
enum ClassType{
     UObjectClass,
     URectViewClass,
     UDialogClass,
};
 
struct UObject
{
     virtual char* GetClassName() const
     {
           return "UObject";
     }
 
     virtual ClassType TypeOfClass()
     {
           return UObjectClass;
     }
};
 
struct UDialog{
     virtual char* GetClassName() const
     {
           return "UDialog";
     };
     virtual ClassType TypeOfClass()
     {
           return UDialogClass;
     };
};
 
struct URectView{
     virtual char* GetClassName() const
     {
           return "URectView";
     };
     virtual ClassType TypeOfClass()
     {
           return URectViewClass;
     };
};
 
void main()
{
     UObject *po=new UObject;
     URectView *pr=new URectView;
     UDialog *pd=new UDialog;
     cout << "po is a " << po->GetClassName() << endl;
     cout << "pr is a " << pr->GetClassName() << endl;
     cout << "pd is a " << pd->GetClassName() << endl;
}

  这种实现方法也就是在基类中提供一个多态的方法,这个方法返回一个类型信息。这样我们能够知道一个指针所指向对象的具体类型,可以满足一些简单的要求。

  但是很显然,这样的方法只实现了typeid的部分功能,还存在很多缺点:

  1用户每增加一个类必须覆盖GetClassNameTypeOfClass两个方法,如果忘了,会导致程序错误。

  2这里的类名和类标识信息不足以实现dynamic_cast的功能,从这个意义上而言此方案根本不能称为RTTI

  3用户必须手工维护每个类的类名与标识,这限制了以库的方式提供给用户的可能。

  4用户必须手工添加GetClassNameTypeOfClass两个方法,使用并不方便。

  其中上面的部分问题我们可以采用C/C++中的宏技巧(Macro Magic)来解决,这个可以在我们的最终解决方案的代码中看到。下面采用方案二中将予以解决上述问题。
 
方案二:以一个类型表来存储类型信息

  这种方法考虑使用一个类结构,除了保留原有的整型类ID,类名字符串外,增加了一个指向基类TypeInfo成员的指针。
struct TypeInfo
{
     char* className;
     int type_id;
     TypeInfo* pBaseClass;
     operator== (const TypeInfo& info){
           return this==&info;
     }
     operator!= (const TypeInfo& info){
           return this!=&info;
     }
};
  
            从这里可以看到,以这种方式实现的RTTI不支持多重继承。所幸多重继承在程序设计中并非必须,而且也不推荐。下面的代码中,我将为DP9900软件项目组中类层次结构中的几个类添加RTTI功能。DP9900项目中,绝大部分的类都以单继承方式从UObject这个根类直接或间接继承而来。这样我们就可以从UObject开始,加入我们RTTI支持所需要的数据和方法。
class UObject
{
public:
     bool IsKindOf(TypeInfo& cls); //判别某个对象是否属于某一个类
public:
     virtual int GetTypeID(){return rttiTypeInfo.type_id;}
     virtual char* GetTypeName(){return rttiTypeInfo.className;}
     virtual TypeInfo& GetTypeInfo(){return rttiTypeInfo;}
     static TypeInfo& GetTypeInfoClass(){return rttiTypeInfo;}
private:
     static TypeInfo rttiTypeInfo;
};
//依次为classNametype_idpBaseClass赋值
TypeInfo UObject::rttiTypeInfo={"UObject",0,NULL};

  考虑从UObject将这个TypeInfo类作为每一个新增类的静态成员,这样一个类的所有对象将共享TypeInfo的唯一实例。我们希望能够在程序运行之前就为type_id,className做好初始化,并让pBaseClass指向基类的这个TypeInfo

  每个类的TypeInfo成员约定使用rttiTypeInfo的命名,为了避免命名冲突,我们将其作为private成员。有了基类的支持并不够,当用户需要RTTI支持,还需要自己来做一些事情:

  1派生类需要从UObject继承。

  2添加rttiTypeInfo变量。

  3在类外正确初始化rttiTypeInfo静态成员。

  4覆盖GetTypeIDGetTypeNameGetTypeInfoGetTypeInfoClass四个成员函数。

  如下所示:
class UView:public UObject
{
public:
     virtual int GetTypeID(){return rttiTypeInfo.type_id;}
     virtual char* GetTypeName(){return rttiTypeInfo.className;}
     virtual TypeInfo& GetTypeInfo(){return rttiTypeInfo;}
     static TypeInfo& GetTypeInfoClass(){return rttiTypeInfo;}
private:
     static TypeInfo rttiTypeInfo;
};

  有了前三步,这样我们就可以得到一个不算太复杂的链表――这是一棵类型信息构成的"",与数据结构中的树的唯一差别就是其指针方向相反。

  这样,从任何一个UObject的子类,顺着pBaseClass往上找,总能遍历它的所有父类,最终到达UObject

  在这个链表的基础上,要判别某个对象是否属于某一个类就很简单。下面给出UObject::IsKindOf()的实现。
 
 
 
bool UObject::IsKindOf(TypeInfo& cls)
{
     TypeInfo* p=&(this->GetTypeInfo());
     while(p!=NULL){
           if(p->type_id==cls.type_id)
                return true;
           p=p->pBaseClass;
     }
     return false;
}

  有了IsKindOf的支持,dynamic_cast的功能也就可以用一个简单的safe_cast来实现:
template
inline T* safe_cast(UObject* ptr,TypeInfo& cls)
{
     return (ptr->IsKindOf(cls)?(T*)ptr:NULL);
}

  至此,我们已经能够从功能上完成前面的目标了,不过用户要使用这个类库的RTTI功能还很麻烦,要敲入一大堆对他们毫无意义的函数代码,要在初始化rttiTypeInfo静态成员时手工设置类ID与类名。其实这些麻烦完全不必交给我们的用户,适当采用一些宏技巧(Macro Magic),就可以让C++的预处理器来替我们写很多枯燥的代码。关于宏不是本文的重点,你可以从最终代码清单看到它们。下面再谈谈关于类ID的问题。

  ID

  为了使不同类型的对象可区分,用一个给每个TypeInfo对象一个类ID来作为比较的依据是必要的。其实对于我们这里的需求和实现方法而言,其实类ID并不是必须的。每一个支持RTTI的类都包含了一个静态TypeInfo对象,这个对象的地址就是在进程中全局唯一。但考虑到其他一些技术如:动态对象创建、对象序列化等,它们可能会要求RTTI给出一个静态不变的ID。在本文的实现中,对此作了有益的尝试。

  首先声明一个用来产生递增类ID的全局变量。再声明如下一个结构,没有数据成员,只有一个构造函数用于初始化TypeInfo的类ID
extern int TypeInfoOrder=0;
struct InitTypeInfo
{
     InitTypeInfo(TypeInfo* info)
     {
           info->type_id=TypeInfoOrder++;
     }
};
  为UObject添加一个private的静态成员及其初始化:
class UObject
{
     //……
private:
     static InitTypeInfo initClassInfo;
};
InitTypeInfo UObject::initClassInfo(&(UObject::rttiTypeInfo));

  并且对每一个从UObject派生的子类也进行同样的添加。这样您将看到,在C++主函数执行前,启动代码将替我们调用每一个类的initClassInfo成员的构造函数InitTypeInfo::InitTypeInfo(TypeInfo* info),而正是这个函数替我们产生并设置了类IDInitTypeInfo的构造函数还可以替我们做其他一些有用的初始化工作,比如将所有的TypeInfo信息登录到一个表格里,让我们可以很方便的遍历它。

  但实践与查阅资料让我们发现,由于C++中对静态成员初始化的顺序没有明确的规定,所以这样的方式产生出来的类ID并非完全静态,换一个编译器编译执行产生的结果可能完全不同。

  还有一个可以考虑的方案是采用某种无冲突HASH算法,将类名转换成为一个唯一整数。使用标准CRC32算法从类型名计算出一个整数作为类ID也许是个不错的想法[3]

  程序清单
// URtti.h
#ifndef __URTTI_H__
#define __URTTI_H__
 
class UObject;
 
struct TypeInfo
{
     char* className;
     int type_id;
     TypeInfo* pBaseClass;
     operator== (const TypeInfo& info){
           return this==&info;
     }
     operator!= (const TypeInfo& info){
           return this!=&info;
     }
};
 
 
 
 
inline std::ostream& operator<< (std::ostream& os,TypeInfo& info)
{
     return (os<< "[" << &info << "]" << "/t"
           << info.type_id << ":"
           << info.className << ":"
           << info.pBaseClass << std::endl);
}
 
extern int TypeInfoOrder;
 
struct InitTypeInfo
{
     InitTypeInfo(/*TypeInfo* base,*/TypeInfo* info)
     {
           info->type_id=TypeInfoOrder++;
     }
};
 
#define TYPEINFO_OF_CLASS(class_name) (class_name::GetTypeInfoClass())
#define TYPEINFO_OF_OBJ(obj_name) (obj_name.GetTypeInfo())
#define TYPEINFO_OF_PTR(ptr_name) (ptr_name->GetTypeInfo())
 
#define DECLARE_TYPEINFO(class_name) /
public: /
     virtual int GetTypeID(){return TYPEINFO_MEMBER(class_name).type_id;} /
     virtual char* GetTypeName(){return TYPEINFO_MEMBER(class_name).className;} /
     virtual TypeInfo& GetTypeInfo(){return TYPEINFO_MEMBER(class_name);} /
     static TypeInfo& GetTypeInfoClass(){return TYPEINFO_MEMBER(class_name);} /
private: /
     static TypeInfo TYPEINFO_MEMBER(class_name); /
     static InitTypeInfo initClassInfo; /
 
#define IMPLEMENT_TYPEINFO(class_name,base_name) /
     TypeInfo class_name::TYPEINFO_MEMBER(class_name)= /
{#class_name,0,&(base_name::GetTypeInfoClass())}; /
     InitTypeInfo class_name::initClassInfo(&(class_name::TYPEINFO_MEMBER(class_name)));
 
#define DYNAMIC_CAST(object_ptr,class_name) /
     safe_cast(object_ptr,TYPEINFO_OF_CLASS(class_name))
 
#define TYPEINFO_MEMBER(class_name) rttiTypeInfo
 
class UObject
{
public:
     bool IsKindOf(TypeInfo& cls);
public:
     virtual int GetTypeID(){return TYPEINFO_MEMBER(UObject).type_id;}
     virtual char* GetTypeName(){return TYPEINFO_MEMBER(UObject).className;}
     virtual TypeInfo& GetTypeInfo(){return TYPEINFO_MEMBER(UObject);}
     static TypeInfo& GetTypeInfoClass(){return TYPEINFO_MEMBER(UObject);}
private:
     static TypeInfo TYPEINFO_MEMBER(UObject);
     static InitTypeInfo initClassInfo;
};
 
template
inline T* safe_cast(UObject* ptr,TypeInfo& cls)
{
     return (ptr->IsKindOf(cls)?(T*)ptr:NULL);
}
#endif
// URtti.cpp
#include "urtti.h"
 
extern int TypeInfoOrder=0;
 
TypeInfo UObject::TYPEINFO_MEMBER(UObject)={"UObject",0,NULL};
InitTypeInfo UObject::initClassInfo(&(UObject::TYPEINFO_MEMBER(UObject)));
 
bool UObject::IsKindOf(TypeInfo& cls)
{
     TypeInfo* p=&(this->GetTypeInfo());
     while(p!=NULL){
           if(p->type_id==cls.type_id)
                return true;
           p=p->pBaseClass;
     }
     return false;
}
// mail.cpp
#include
#include "urtti.h"
using namespace std;
 
class UView:public UObject
{
     DECLARE_TYPEINFO(UView)
};
IMPLEMENT_TYPEINFO(UView,UObject)
 
 
class UGraph:public UObject
{
     DECLARE_TYPEINFO(UGraph)
};
IMPLEMENT_TYPEINFO(UGraph,UObject)
 
void main()
{
     UObject* po=new UObject;
     UView* pv=new UView;
     UObject* pg=new UGraph;
     if(DYNAMIC_CAST(po,UView))
           cout << "po => UView succeed" << std::endl;
     else
           cout << "po => UView failed" << std::endl;
     if(DYNAMIC_CAST(pv,UView))
           cout << "pv => UView succeed" << std::endl;
     else
           cout << "pv => UView failed" << std::endl;
     if(DYNAMIC_CAST(po,UGraph))
           cout << "po => UGraph succeed" << std::endl;
     else
           cout << "po => UGraph failed" << std::endl;
     if(DYNAMIC_CAST(pg,UGraph))
           cout << "pg => UGraph succeed" << std::endl;
     else
           cout << "pg => UGraph failed" << std::endl;
}
 

  实现结果

  本文实现了如下几个宏来支持RTTI,它们的使用方法都可以在上面的代码中找到:
  
宏函数
功能及参数说明
DECLARE_TYPEINFO(class_name)
为类添加RTTI功能放在类声明的起始位置
IMPLEMENT_TYPEINFO(class_name,base)
同上,放在类定义任何位置
TYPEINFO_OF_CLASS(class_name)
相当于typeid(类名)
TYPEINFO_OF_OBJ(obj_name)
相当于typeid(对象)
TYPEINFO_OF_PTR(ptr_name)
相当于typeid(指针)
DYNAMIC_CAST(object_ptr,class_name)
相当于dynamic_castobject_ptr
 
性能测试

  测试代码:

  这里使用相同次数的DYNAMIC_CASTdynamic_cast进行对比测试,在VC6.0下编译运行,使用默认的Release编译配置选项。为了避免编译器优化导致的不公平测试结果,我在循环中加入了无意义的计数操作。
void main()
{
     UObject* po=new UObject;
     UView* pv=new UView;
     UObject* pg=new UGraph;
     int a,b,c,d;
     a=b=c=d=0;
     const int times=30000000;
     cerr << "时间测试输出:" << endl;
     cerr << "start my DYNAMIC_CAST at: " << time(NULL) << endl;
     for(int i=0;i<TIMES;I++){
           if(DYNAMIC_CAST(po,UView)) a++; else a--;
           if(DYNAMIC_CAST(pv,UView)) b++; else b--;
           if(DYNAMIC_CAST(po,UGraph)) c++; else c--;
           if(DYNAMIC_CAST(pg,UGraph)) d++; else d--;
     }
     cerr << "end my DYNAMIC_CAST at: " << time(NULL) << endl;
     cerr << "start c++ dynamic_cast at: " << time(NULL) << endl;
     for(i=0;i<TIMES;I++){
           if(dynamic_cast(po)) a++; else a--;
           if(dynamic_cast(pv)) b++; else b--;
           if(dynamic_cast(po)) c++; else c--;
           if(dynamic_cast(pg)) d++; else d--;
     }
     cerr << "end c++ dynamic_cast at: " << time(NULL) << endl;
     cerr << a << b << c << d << endl;
}

  运行结果:
start my DYNAMIC_CAST at: 1021512140
end my DYNAMIC_CAST at: 1021512145
start c++ dynamic_cast at: 1021512145
end c++ dynamic_cast at: 1021512160

  这是上述条件下的测试输出,我们可以看到,本文实现的这个精简RTTI方案运行DYNAMIC_CAST的时间开销只有dynamic_cast1/3。为了得到更全面的数据,还进行了DEBUG编译配置选项下的测试。

  输出:
start my DYNAMIC_CAST at: 1021512041
end my DYNAMIC_CAST at: 1021512044
start c++ dynamic_cast at: 1021512044
end c++ dynamic_cast at: 1021512059

  这种情况下DYNAMIC_CAST运行速度要比dynamic_cast慢一倍左右。如果在Release编译配置选项下将UObject::IsKindOf方法改成如下inline函数,我们将得到更让人兴奋的结果(DYNAMIC_CAST运行时间只有dynamic_cast1/5)。
inline bool UObject::IsKindOf(TypeInfo& cls)
{
     for(TypeInfo* p=&(this->GetTypeInfo());p!=NULL;p=p->pBaseClass)
           if(p==&cls) return true;
     return false;
}

  输出:
start my DYNAMIC_CAST at: 1021512041
end my DYNAMIC_CAST at: 1021512044
start c++ dynamic_cast at: 1021512044
end c++ dynamic_cast at: 1021512059

  结论:

  由本文的实践可以得出结论,自己动手编码实现RTTI是简单可行的。这样的实现可以在编译器优秀的代码优化中表现出比dynamic_cast更好的性能,而且没有带来过多的存储开销。本文的RTTI以性能为主要设计目标,在实现上一定程度上受到了MFC的影响。适于嵌入式环境。
 
原创粉丝点击