C编译器剖析_3.3 语法分析_C语言的外部声明(2)

来源:互联网 发布:尚观云计算 编辑:程序博客网 时间:2024/06/04 18:54

     在上一小节中,我们讨论了C标准文法的“外部声明ExternalDeclaration”,介绍了“声明Declaration”和“函数定义FunctionDefintion”这两类外部声明,分别举了以下代码作为例子,在图3.3.4和图3.3.7中给出了这两者对应的语法树。

static  const  int  a1= 3, * a2, a3[5],a4(void);//声明Declaration            

int * fn(int aa,double bb,double cc){           //函数定义FunctionDefinition

         return NULL;

}

    我们需要对ucl\decl.c的其他代码进行分析,才能更好理解图3.3.4和图3.3.7的语法树是如何构造出来的。这里可能有个问题,程序的原作者在编程时,在其脑海中就已经有其要构造的语法树的整体轮廓;但是,程序的阅读者在缺乏文档的情况下,只有读完大部分代码,做过分析后才能重构出这棵语法树的概貌。另一个问题是,C标准文法刻画的是C语言这样的无穷集合,不同的C程序对应不同的语法树,而在书中,我们只能选取一些如上所示的简单而又有一定代表性的代码来举例,在还没有介绍完ucl\decl.c的所有函数时,就提前给出形如图3.3.4和图3.3.7这样的语法树预览图,之后结合语法树,就可以更好地阅读和分析ucl\decl.c中的代码。这有点类似于“玩拼图”,在开始动手拼图时,如果能提前知道最终要完成的图案,那应该会更容易些。

     通过上一小节的讨论,我们知道对于“声明”和“函数定义”这两类“外部声明”的分析主要是由ParseCommonHeader()来完成,这个所谓的公共前缀”CommonHeader”实际上就是声明Declaration的候选式;而对于函数定义FunctionDefinition,我们也只是先把其前缀“误当”成和Declaration一样,这样“声明”和“函数定义”才会有如下侯选式所示的CommonHeader,至于两者不一样的地方,我们已经在讨论ParseExternalDeclaration()时进行过修正。

Declaration:

DeclarationSpecifiers       InitDeclaratorListopt  ;

    与这个产生式Declaration对应的例子,例如:

                   static  const int  a1 = 3, * a2, a3[5],a4(void);

    因此,在ParseCommonHeader()函数的基础上,来实现对“声明Declaration”的分析,就是易如反掌的事情,如图3.3.9所示。因为全局变量的声明属于外部声明,已在函数ParseExternalDeclaration()中完成分析,所以此处的ParseDeclaration()函数主要是在ParseCompoundStatement()函数中被调用,用于对局部变量的声明的分析。


图3.3.9   ParseDeclaration()

    在对“声明Declaration”的相关代码做进一步分析前,让我们再次强调一下,上述产生式中的声明说明符DeclarationSpecifiers对应的是形如”static  const int”这样的字符串,int和double等基本类型的处理相对比较简单,这里我们将重点讨论的是“结构或联合说明符StructOrUnionSpecifier”。而可带初值的声明符(即InitDeclarator)对应的是形如”a1 = 3”这样的字符串。我们在第1章讨论ucc\examples\sc时就已介绍过声明符Declarator的概念,在标准C中,可为声明符加上初始化值,构成InitDeclarator,而多个InitDeclarator则构成上述产生式中的InitDeclaratorList。前文所述的a1, * a2,a3[5]和a4(void)都是C语言中的声明符。声明符Declarator中包含了数组、指针和函数等类型信息,而声明说明符DeclarationSpecifiers中则包含了“int和double等基本类型”、结构体类型、联合体类型和枚举类型等信息,两者结合在一起,就构成了C语言的声明Declaration。C程序员通过编写一个声明,来构造一个类型表达式,C编译器利用这些类型表达式来构建类型系统。

     如果去掉上述声明符中的形如a1,a2,a3和a4这样的标志符,剩下的字符串就对应C标准文法中抽象声明符AbstractDeclarator的概念。引入“抽象声明符”的原因在于,在C语言的sizeof()表达式、函数声明中的形参和强制类型转换中,我们关注的类型信息,并不是去声明一个变量,此时,并不需要声明符中的标志符,如下所示。

sizeof(int * [4]);                 //  sizeof(TypeName)

void fdecl(int (*)[4]);         //      ParameterDeclaration in functiondeclaration

(int *) ptr;                            //      (TypeName) UnaryExpression

    由于引入了抽象声明符AbstractDeclarator来刻画函数声明中的形参,所以C标准文法就不能延用之前的非终结符Declaration来描述形参声明,需要另外创建一个被称为“形式参数声明ParameterDeclaration”的非终结符来表达,其产生式如下所示。这个产生式意味着,”void f(int);”和”void f(int a);”都是合法的声明,即在形参声明中,跟在“声明说明符DeclarationSpecifiers”之后的可以是声明符Declarator,也可以是抽象声明符AbstractDeclarator。

parameter-declaration:

                   declaration-specifiers  declarator

                   declaration-specifiers  abstract-declarator

    标准C文法中,还引入了“结构体成员声明符StructDeclarator”的概念,主要是用于描述如下所示的结构体位域成员offset和number。

         struct Entry{

                   int   offset:12;

                   int  number:20;

                   int  date;                 

         }

    “结构体成员声明符StructDeclarator”对应的产生式如下所示,对于结构体定义中的非位域成员,例如上述结构体的date域,我们就完全可以用之前介绍过的“声明符Declarator”来描述。因此,我们看到“结构体声明符StructDeclarator”有两个侯选式。

         struct-declarator:

declarator

declaratoropt :constant-expression

     由于结构体只是用来描述数据结构的,在结构体内部的声明中,我们不需要static、register和auto等跟存储有关的声明说明符。这些信息,只有在需要为整个结构体对象分配存储位置时才需要说明。如果允许结构体内部的声明中出现register和auto等,就可能出现如下情况,data1被建议放在寄存器中,而data2要放于内存栈中,这明显矛盾。

         struct Data{

                   register  int data1;           //StructDeclaration          结构体成员声明

                   auto  int data2;               //StructDeclaration          结构体成员声明

         };

     最终,在C标准文法中,与结构体中成员声明相关的产生式如下所示。从前述的形如”static const int”的声明说明符中删去static,剩下的形如”const int”的说明符就对应如下的“类型说明符和类型限定符列表SpecifierQualifierList”的概念。简单来说,看到非终结符SpecifierQualifierList,我们脑子里浮现出形如”const int”这样的字符串就OK了。而看到声明说明符DeclarationSpecifiers,脑子里出现”staticconst int”就又O了。

struct-declaration:

         specifier-qualifer-list  struct-declarator-list ;

specifier-qualifier-list:

type-specifier  specifier-qualifier-listopt

type-qualifier  specifier-qualifier-listopt

struct-declarator-list:

         struct-declarator

         struct-declarator-list, struct-declarator

     至此,我们介绍了C标准文法中的3类声明符和对应的3类声明,它们是:

     (1)    用于描述全局或局部变量的Declarator,对应的声明是Declaration。Declarator中包含了标志符。

     (2)    用于描述无名形参等与类型相关信息的AbstractDeclarator,对应的声明是ParameterDeclaration。引入AbstractDeclarator的目的是删去Declarator中的标志符。

     (3)    用于描述结构体中某成员的StructDeclarator,对应的声明是StructDeclaration。引入StructDeclarator的目的是为了支持结构体位域成员。

     而为了支持全局变量和局部变量的初始化,引入了“初始化声明符InitDeclarator”的概

念,与之相关的产生式如下所示。看到InitDeclarator,我们脑子里闪现的应是形如”a= 3”这样的式子。

         init-declarator:

                   declarator

            declarator = initializer

    我们知道,在C语言中可以有如下所示的初始化,对于结构体对象和数组的初始化其实是相对比较复杂的,C编译器在语义检查时也是要花费一番功夫的。

         int a = 3;

         int b[10][20] = { {1,2},{3,4},{5,6,7}};

    我们需要引入一个称为“初始化值Initializer”的概念来刻画形如”3”和” { {1,2},{3,4},{5,6,7}}”这样的用来做变量初始化的值。与Initializer相关的产生式如下所示:

       initializer:

assignment-expression

{ initializer-list }

{ initializer-list , }

       initializer-list:

                  initializer

nitializer-list, initialize

      由上述产生式,我们可以知道,我们在3.1节介绍过的AssignmentExpression就可

以作为一个Initializer来使用,例如整数”3”。而“初值列表InitializerList”则是若干个由逗号隔开的Initializer构成,例如”3,4,5,6,7”。如果给这个初值列表再加上一对大括号,则构成了”{3,4,5,6,7}”,这又可以当作用于一维数组进行初始化的初值Initializer。所以在上述产生式中,我们看到{initializer-list }是initializer的一个侯选式。而候选式{ initializer-list , }只是多加了一个逗号而已,纯属满足不同C程序员的不同审美观,这意味着有些C程序员看到”{3,4,5,6,7,}”时会心情更舒畅些。

子曾经曰过,“必也正名乎”。在这一小节,我们对《K&R》附录中与声明相关的C标准文法做了简要介绍,在熟悉这些概念后,再进行ucl\decl.c的代码阅读,就真的会如孔老夫子所说的“名正言顺”。谈到“名正言顺”,我们就顺便对之前未提及的一个细节进行说明一下。在UCC的源代码中,我们看到ParseDeclarationSpecifiers()这样的函数名,但在C标准文法中,我们遇到的却是”declaration-specifiers”,有时我们为了讨论方便,也就直接用函数名中的DeclarationSpecifiers来代表正式文法中的非终结符declaration-specifiers了。而在UCC的源代码注释中,我们又会看到用形如[declaration-specifiers]这样的式子,来表示declaration-specifiers可有可无,但在C标准文法中看到的是declaration-specifiersopt,原因其实很简单,在源代码编辑器中,没办法如Word那样标出下标opt来,所以就用一对方括号来表示可用可无。

    下一小节,就让我们名正言顺地去分析与声明相关的代码。阅读《K&R》附录中那6页薄薄的C标准文法的窍门在于,要想到这个非终结符是用来描述什么样的字符串,例如,看到DeclarationSpecifiers,我们能想到形如”staticconst int”就OK,其他的事情就要相信我们自己大脑的联想能力了。

Declaration      形如  int  a1=3, * a2, a3[5],a4(void);

                            其中int可用其他DeclarationSpecifiers来替代

Declarator        形如   a1, * a2, a3[5]和a4(void)

InitDeclarator  形如   a1 = 3,着眼点是”=3”

AbstractDeclarator 形如         int  (*)[4]中的”(*)[4]”,出发点是“无名”

StructDeclarator      形如  b:20,重点是”:20”的位域说明

DeclarationSpecifiers 形如 “static constint”,

                           其中类型说明符int也可用StructOrUnionSpecifier来替换

SpecifierQualifierList 形如 “const int”

StructOrUnionSpecifier  形如   struct Data{

                       int  a;         // StructDeclaration

                       int  b:20;      // StructDeclaration

                               }

0 0