C语言文法

来源:互联网 发布:jira 数据库配置文件 编辑:程序博客网 时间:2024/04/29 06:10

C语言一共有41个操作符,分15个优先级。

因为优先级不同,导致的结合性不同,所以需要为不同的优先级引入非终结符号抽象。

如果按照标准EBNF文法,需要为每一个优先级引入一个非终结符号,然后再为每个终结符号编写对应的分析函数,这样需要15个分析函数。

这样虽然合理,但是对于C语言这种比较简单的语言来说,却显多余。

假设一个C语言表达式如下:

expr: term{ + term}//抽象加表达式

term:factor {* factor}//乘法表达式

factor:ID | '(' expr ')'//基础表达式或者终结符号

则对于expr的分析函数为expr():term();while(t == +){get_next_token(); term();}

对于term的分析函数term():factor();while(t == *){get_next_token(); facor();}

factor用来处理终结符号或者基础表达式。

这个文法基本来说具有两个优先级,需要三个非终结符号抽象,一个+,一个*,还有一个基本表达式。

但是看上面标红的两行来说,格式基本一致,只是调用的具体分析函数term和factor不同,最终都会调用到最后的分析函数factor。

所以对于二元运算符来说,在处理到最高优先级之前的递归逻辑都几乎一致。

parser(priority){

     if(priority > 最大的二元运算符优先级)

     {factor();}

     else

        parser(++priority);

}

这将大大的减小了二元运算符的分析函数数量。

也就将所有的41个运算符实际上分成了5类,逗号运算符,赋值运算符,条件运算符,其他二元运算符,一元运算符(包括前缀和后缀),

这样就用5个解析函数解析了15的优先级共41个运算符,当前这中间有些细节需要处理,更具体的介绍请参考下面的文法介绍部分

比如处理结合性等。

下面附一张c语言所有运算符信息表。

运算符优先级结合性,1左结合= += -= *= /+ %= &= ^= |= <<= >>=2右结合? :3右结合||4左结合&&5左结合|6左结合^7左结合&8左结合== != 9左结合< > <= >=10左结合>> <<11左结合+ -12左结合* / %13左结合* & - + ! ~ ++ -- sizeof(前缀)14左结合++ --(后缀)15左结合

依据上面的分析和运算符表,下面给出C语言的完整表达式EBNF语法表示和在lcc中使用的分析函数(标红的部分):

expression://使用expr函数

assignment-expression{, assignment-expression}

assignment-expression://使用expr1函数

conditional-expression

unary-expression assign-operator assignment-expression

assign-operator:

= += -= *= /= %= <<= >>= &= ^= |=

conditional-experssion://使用expr2函数

binary-expression{?expression:conditional-expression}

binary-expression://使用expr3函数

unary-expression{binary-operator unary-expression}

binary-operator:

|| && | ^ & == != < > <= >= << >> + - * / %

unary-expression://使用unary函数

postfix-expression

unary-operator unary-expression

'('type-name')' unary-expression

sizeof unary-expression

sizeof '('type-name')'

postfix-expression://使用postfix函数

primay-expression{postfix-operator}

postfix-operator:

'['expression']'

'('[ assignment-expression{, assignment-expression}]')'

.identifier

->identifier

++

--

primay-expression:终结符号,无需分析

id

constant

string-literal

'('expression')'

0 0