C编译器剖析_3.3 语法分析_C语言的外部声明(2)
来源:互联网 发布:尚观云计算 编辑:程序博客网 时间:2024/06/04 18:54
在上一小节中,我们讨论了C标准文法的“外部声明ExternalDeclaration”,介绍了“声明Declaration”和“函数定义FunctionDefintion”这两类外部声明,分别举了以下代码作为例子,在图3.3.4和图3.3.7中给出了这两者对应的语法树。
static const int a1= 3, * a2, a3[5],a4(void);//声明Declaration
int * fn(int aa,double bb,double cc){ //函数定义FunctionDefinition
return NULL;
}
我们需要对ucl\decl.c的其他代码进行分析,才能更好理解图3.3.4和图3.3.7的语法树是如何构造出来的。这里可能有个问题,程序的原作者在编程时,在其脑海中就已经有其要构造的语法树的整体轮廓;但是,程序的阅读者在缺乏文档的情况下,只有读完大部分代码,做过分析后才能重构出这棵语法树的概貌。另一个问题是,C标准文法刻画的是C语言这样的无穷集合,不同的C程序对应不同的语法树,而在书中,我们只能选取一些如上所示的简单而又有一定代表性的代码来举例,在还没有介绍完ucl\decl.c的所有函数时,就提前给出形如图3.3.4和图3.3.7这样的语法树预览图,之后结合语法树,就可以更好地阅读和分析ucl\decl.c中的代码。这有点类似于“玩拼图”,在开始动手拼图时,如果能提前知道最终要完成的图案,那应该会更容易些。
通过上一小节的讨论,我们知道对于“声明”和“函数定义”这两类“外部声明”的分析主要是由ParseCommonHeader()来完成,这个所谓的公共前缀”CommonHeader”实际上就是声明Declaration的候选式;而对于函数定义FunctionDefinition,我们也只是先把其前缀“误当”成和Declaration一样,这样“声明”和“函数定义”才会有如下侯选式所示的CommonHeader,至于两者不一样的地方,我们已经在讨论ParseExternalDeclaration()时进行过修正。
Declaration:
DeclarationSpecifiers InitDeclaratorListopt ;
与这个产生式Declaration对应的例子,例如:
static const int a1 = 3, * a2, a3[5],a4(void);
因此,在ParseCommonHeader()函数的基础上,来实现对“声明Declaration”的分析,就是易如反掌的事情,如图3.3.9所示。因为全局变量的声明属于外部声明,已在函数ParseExternalDeclaration()中完成分析,所以此处的ParseDeclaration()函数主要是在ParseCompoundStatement()函数中被调用,用于对局部变量的声明的分析。
图3.3.9 ParseDeclaration()
在对“声明Declaration”的相关代码做进一步分析前,让我们再次强调一下,上述产生式中的声明说明符DeclarationSpecifiers对应的是形如”static const int”这样的字符串,int和double等基本类型的处理相对比较简单,这里我们将重点讨论的是“结构或联合说明符StructOrUnionSpecifier”。而可带初值的声明符(即InitDeclarator)对应的是形如”a1 = 3”这样的字符串。我们在第1章讨论ucc\examples\sc时就已介绍过声明符Declarator的概念,在标准C中,可为声明符加上初始化值,构成InitDeclarator,而多个InitDeclarator则构成上述产生式中的InitDeclaratorList。前文所述的a1, * a2,a3[5]和a4(void)都是C语言中的声明符。声明符Declarator中包含了数组、指针和函数等类型信息,而声明说明符DeclarationSpecifiers中则包含了“int和double等基本类型”、结构体类型、联合体类型和枚举类型等信息,两者结合在一起,就构成了C语言的声明Declaration。C程序员通过编写一个声明,来构造一个类型表达式,C编译器利用这些类型表达式来构建类型系统。
如果去掉上述声明符中的形如a1,a2,a3和a4这样的标志符,剩下的字符串就对应C标准文法中抽象声明符AbstractDeclarator的概念。引入“抽象声明符”的原因在于,在C语言的sizeof()表达式、函数声明中的形参和强制类型转换中,我们关注的类型信息,并不是去声明一个变量,此时,并不需要声明符中的标志符,如下所示。
sizeof(int * [4]); // sizeof(TypeName)
void fdecl(int (*)[4]); // ParameterDeclaration in functiondeclaration
(int *) ptr; // (TypeName) UnaryExpression
由于引入了抽象声明符AbstractDeclarator来刻画函数声明中的形参,所以C标准文法就不能延用之前的非终结符Declaration来描述形参声明,需要另外创建一个被称为“形式参数声明ParameterDeclaration”的非终结符来表达,其产生式如下所示。这个产生式意味着,”void f(int);”和”void f(int a);”都是合法的声明,即在形参声明中,跟在“声明说明符DeclarationSpecifiers”之后的可以是声明符Declarator,也可以是抽象声明符AbstractDeclarator。
parameter-declaration:
declaration-specifiers declarator
declaration-specifiers abstract-declarator
标准C文法中,还引入了“结构体成员声明符StructDeclarator”的概念,主要是用于描述如下所示的结构体位域成员offset和number。
struct Entry{
int offset:12;
int number:20;
int date;
}
“结构体成员声明符StructDeclarator”对应的产生式如下所示,对于结构体定义中的非位域成员,例如上述结构体的date域,我们就完全可以用之前介绍过的“声明符Declarator”来描述。因此,我们看到“结构体声明符StructDeclarator”有两个侯选式。
struct-declarator:
declarator
declaratoropt :constant-expression
由于结构体只是用来描述数据结构的,在结构体内部的声明中,我们不需要static、register和auto等跟存储有关的声明说明符。这些信息,只有在需要为整个结构体对象分配存储位置时才需要说明。如果允许结构体内部的声明中出现register和auto等,就可能出现如下情况,data1被建议放在寄存器中,而data2要放于内存栈中,这明显矛盾。
struct Data{
register int data1; //StructDeclaration 结构体成员声明
auto int data2; //StructDeclaration 结构体成员声明
};
最终,在C标准文法中,与结构体中成员声明相关的产生式如下所示。从前述的形如”static const int”的声明说明符中删去static,剩下的形如”const int”的说明符就对应如下的“类型说明符和类型限定符列表SpecifierQualifierList”的概念。简单来说,看到非终结符SpecifierQualifierList,我们脑子里浮现出形如”const int”这样的字符串就OK了。而看到声明说明符DeclarationSpecifiers,脑子里出现”staticconst int”就又O了。
struct-declaration:
specifier-qualifer-list struct-declarator-list ;
specifier-qualifier-list:
type-specifier specifier-qualifier-listopt
type-qualifier specifier-qualifier-listopt
struct-declarator-list:
struct-declarator
struct-declarator-list, struct-declarator
至此,我们介绍了C标准文法中的3类声明符和对应的3类声明,它们是:
(1) 用于描述全局或局部变量的Declarator,对应的声明是Declaration。Declarator中包含了标志符。
(2) 用于描述无名形参等与类型相关信息的AbstractDeclarator,对应的声明是ParameterDeclaration。引入AbstractDeclarator的目的是删去Declarator中的标志符。
(3) 用于描述结构体中某成员的StructDeclarator,对应的声明是StructDeclaration。引入StructDeclarator的目的是为了支持结构体位域成员。
而为了支持全局变量和局部变量的初始化,引入了“初始化声明符InitDeclarator”的概
念,与之相关的产生式如下所示。看到InitDeclarator,我们脑子里闪现的应是形如”a= 3”这样的式子。
init-declarator:
declarator
declarator = initializer
我们知道,在C语言中可以有如下所示的初始化,对于结构体对象和数组的初始化其实是相对比较复杂的,C编译器在语义检查时也是要花费一番功夫的。
int a = 3;
int b[10][20] = { {1,2},{3,4},{5,6,7}};
我们需要引入一个称为“初始化值Initializer”的概念来刻画形如”3”和” { {1,2},{3,4},{5,6,7}}”这样的用来做变量初始化的值。与Initializer相关的产生式如下所示:
initializer:
assignment-expression
{ initializer-list }
{ initializer-list , }
initializer-list:
initializer
nitializer-list, initialize
由上述产生式,我们可以知道,我们在3.1节介绍过的AssignmentExpression就可
以作为一个Initializer来使用,例如整数”3”。而“初值列表InitializerList”则是若干个由逗号隔开的Initializer构成,例如”3,4,5,6,7”。如果给这个初值列表再加上一对大括号,则构成了”{3,4,5,6,7}”,这又可以当作用于一维数组进行初始化的初值Initializer。所以在上述产生式中,我们看到{initializer-list }是initializer的一个侯选式。而候选式{ initializer-list , }只是多加了一个逗号而已,纯属满足不同C程序员的不同审美观,这意味着有些C程序员看到”{3,4,5,6,7,}”时会心情更舒畅些。
子曾经曰过,“必也正名乎”。在这一小节,我们对《K&R》附录中与声明相关的C标准文法做了简要介绍,在熟悉这些概念后,再进行ucl\decl.c的代码阅读,就真的会如孔老夫子所说的“名正言顺”。谈到“名正言顺”,我们就顺便对之前未提及的一个细节进行说明一下。在UCC的源代码中,我们看到ParseDeclarationSpecifiers()这样的函数名,但在C标准文法中,我们遇到的却是”declaration-specifiers”,有时我们为了讨论方便,也就直接用函数名中的DeclarationSpecifiers来代表正式文法中的非终结符declaration-specifiers了。而在UCC的源代码注释中,我们又会看到用形如[declaration-specifiers]这样的式子,来表示declaration-specifiers可有可无,但在C标准文法中看到的是declaration-specifiersopt,原因其实很简单,在源代码编辑器中,没办法如Word那样标出下标opt来,所以就用一对方括号来表示可用可无。
下一小节,就让我们名正言顺地去分析与声明相关的代码。阅读《K&R》附录中那6页薄薄的C标准文法的窍门在于,要想到这个非终结符是用来描述什么样的字符串,例如,看到DeclarationSpecifiers,我们能想到形如”staticconst int”就OK,其他的事情就要相信我们自己大脑的联想能力了。
Declaration 形如 int a1=3, * a2, a3[5],a4(void);
其中int可用其他DeclarationSpecifiers来替代
Declarator 形如 a1, * a2, a3[5]和a4(void)
InitDeclarator 形如 a1 = 3,着眼点是”=3”
AbstractDeclarator 形如 int (*)[4]中的”(*)[4]”,出发点是“无名”
StructDeclarator 形如 b:20,重点是”:20”的位域说明
DeclarationSpecifiers 形如 “static constint”,
其中类型说明符int也可用StructOrUnionSpecifier来替换
SpecifierQualifierList 形如 “const int”
StructOrUnionSpecifier 形如 struct Data{
int a; // StructDeclaration
int b:20; // StructDeclaration
}
- C编译器剖析_3.3 语法分析_C语言的外部声明(2)
- C编译器剖析_3.3 语法分析_C语言的外部声明(3)
- C编译器剖析_3.3 语法分析_C语言的外部声明(1)
- C编译器剖析_3.2 语法分析_C语言的语句
- C编译器剖析_3.1 语法分析_C语言的表达式(2)
- C编译器剖析_3.1 语法分析_C语言的表达式(1)
- C编译器剖析_C语言的变参函数
- C编译器剖析_4.4 语义检查_外部声明_类型结构的构建(2)
- C编译器剖析_4.4 语义检查_外部声明_类型结构的构建(1)
- C--语言编译器语法分析完成,小小的记录一下
- C编译器剖析_4.4 语义检查_外部声明_内部连接和外部连接
- C编译器剖析_4.4 语义检查_外部声明_结构体和数组的初始化
- C编译器剖析_4.4 语义检查_外部声明_临门一脚
- C编译器剖析_2.4 C语言的类型系统
- 关于《C语言深度剖析》之编译器的bug问题
- C语言学习_C Primer Plus:关于声明变量和printf的先后问题
- 编译原理课程设计_C--编译器_语法分析&代码生成
- 编译原理课程设计_C--编译器_语法分析&代码生成 - Justin
- 无题
- Android快速开发框架-AIO
- IT人的网站
- Linux 路由 (2)
- Ubuntu 12.04中文输入法的安装
- C编译器剖析_3.3 语法分析_C语言的外部声明(2)
- “C语言” 读书札记(六)之[Linux下C语言编程环境Make命令和Makefile]
- 表类型
- Jetty 7 + eclipse + servlet 最简单的HELLO WORLD
- log4jdbc日志框架介绍
- Java枚举类型
- SQL表函数的BUG
- iOS将状态栏的背景设为空
- CentOS 6下开启PHP错误提示