词法分析
来源:互联网 发布:vscode terminal 编辑:程序博客网 时间:2024/06/05 03:33
一、实验目的
(1) 理解词法分析的功能;
(2) 理解词法分析的实现方法;
二、实验内容
PL0的文法如下
‘< >’为非终结符。
‘::=’ 该符号的左部由右部定义,可读作“定义为”。
‘|’ 表示‘或’,为左部可由多个右部定义。
‘{ }’ 表示花括号内的语法成分可以重复。在不加上下界时可重复0到任意次数,有上下界时可重复次数的限制。
‘[ ]’ 表示方括号内的成分为任选项。
‘( )’ 表示圆括号内的成分优先。
上述符号为“元符号”, 文法用上述符号作为文法符号时需要用引号‘’括起。
〈程序〉∷=〈分程序〉.
〈分程序〉∷= [〈变量说明部分〉][〈过程说明部分〉]〈语句〉
〈变量说明部分〉∷=VAR〈标识符〉{,〈标识符〉}:INTEGER;
〈无符号整数〉∷=〈数字〉{〈数字〉}
〈标识符〉∷=〈字母〉{〈字母〉|〈数字〉}
〈过程说明部分〉∷=〈过程首部〉〈分程序〉{;〈过程说明部分〉};
〈过程首部〉∷=PROCEDURE〈标识符〉;
〈语句〉∷=〈赋值语句〉|〈条件语句〉|〈过程调用语句〉|〈读语句〉|〈写语句〉|〈复合语句〉|〈空〉
〈赋值语句〉∷=〈标识符〉∶=〈表达式〉
〈复合语句〉∷=BEGIN〈语句〉{;〈语句〉}END
〈条件〉∷=〈表达式〉〈关系运算符〉〈表达式〉
〈表达式〉∷=〈项〉{〈加法运算符〉〈项〉}
〈项〉∷=〈因子〉{〈乘法运算符〉〈因子〉}
〈因子〉∷=〈标识符〉|〈无符号整数〉|’(‘〈表达式〉’)’
〈加法运算符〉∷=+|-
〈乘法运算符〉∷=*
〈关系运算符〉∷=<>|=|<|<=|>|>=
〈条件语句〉∷=IF〈条件〉THEN〈语句〉
〈字母〉∷=a|b|…|X|Y|Z
〈数字〉∷=0|1|2|…|8|9
实验要求:实现PL0程序的词法分析
1. 完成实验的要求
(1)条件语句改为:
<条件语句> ::= IF <条件> THEN <语句> [ELSE <语句>]
即增加保留字 ELSE
(2)增加注释:
单行注释:
单行注释以“//”开始,以回车结束。例如下面是一个示例:
//I am comment.
多行注释:
以“{”开始,以“}”结束。例如下面是一个示例:
{ I am comment. }
(3)识别出整数和实数,并区别
代码已经测试
#include <stdio.h>#include<stdlib.h>#include<string.h>#include<ctype.h>#define norw 11 //norw-1个关键字#define al 20 //最长的关键字的长度#define ID norw#define INT norw+1#define COMMA norw+2#define ENDF norw+3#define COLON norw+4#define SEMIC norw+5#define ADD norw+6#define MINUS norw+7#define MULTI norw+8#define EVALU norw+9#define LE norw+10#define NE norw+11#define LT norw+12#define EQ norw+13#define GE norw+14#define GT norw+15#define FLOAT norw+16char TOKEN[20]; //字符数组用来依次存放单词词文的各个字符extern int lookup(char *); //以TOKEN字符串查保留字表extern void report_error(char); //报告程序中的词法错误bool isalpha(char); //判断接收字符是否为字母bool isalnum(char); //判断接收字符是否为字母或者数字bool isdigit(char); //判断接收字符是否为数字FILE* fin;FILE* fout;void scanner(){ //词法分析的主体程序,对输入的文本文件进行词法分析 char ch; int i,c; int error=0; //记录文件中词法错误的个数 ch=fgetc(fin); //从输入文件中读取一个字符 while(ch!=EOF) { //当从输入文件接收的字符不是文件结束符时,执行循环 if(isalpha(ch)) { //如果从输入文件接收的第一个字符是字母 TOKEN[0]=ch; ch=fgetc(fin); i=1; while(isalnum(ch)) { TOKEN[i]=ch; i++; ch=fgetc(fin); } TOKEN[i]='\0'; c=lookup(TOKEN); //查保留字表 if(c==0) { fprintf(fout,"(%d,%s)\n", ID,TOKEN); //输出标识符 } else fprintf(fout,"(%d,%s)\n", c,TOKEN); //输出接收单词为保留字 } if(isdigit(ch)) //如果从输入文件接收的第一个字符是数字 { int cdot=0; //统计小数点个数 TOKEN[0]=ch; ch=fgetc(fin); i=1; while(isdigit(ch)||ch=='.') { //从第二个接收字符开始,当是数字或者是小数点时,执行循环 if(ch=='.') cdot++; TOKEN[i]=ch; i++; ch=fgetc(fin);//重复接收字符,直到接收到非数字 if(cdot>=2) { error++; TOKEN[i]='\0'; printf("%s is error\n", TOKEN); break; } } if(isalpha(ch)) //如果第二个字符是字母 { while(isalpha(ch)) //接收完所有的字母,跳出循环 { TOKEN[i]=ch; i++; ch=fgetc(fin); } TOKEN[i]='\0'; error++; printf("%s is error\n", TOKEN); } else if(cdot==0) //当接收的字符为整型单词时 { int x=0; fseek(fin,-1,1); TOKEN[i]='\0'; for(int j=0; j<i; j++) { x=(TOKEN[j]-'0')*(10^(--i))+x; } fprintf(fout,"(%d,%d)\n", INT, x);//输出为数字 } else if(cdot==1) { fseek(fin,-1,1); TOKEN[i]='\0'; int a,part1=0,jc,b=0,e=0; //b用来确定小数点所在的位置 float c=0.1,part2=0.0; for(e=0; e<i; e++) { if(TOKEN[e]!='.') b=e; } int m=b; int x1=0; float x2=0.0; for(int j=0; j<m; j++) { x1=(TOKEN[i]-'0')*(10^(--m))+x1; } for(int j=b+1; j<i; j++) { c=1; for(int y=0; y<(j=b); j++) { c=c*0.1; } x2=x2+float((TOKEN[j]-'0'))*c; } fprintf(fout,"(%d,%f)\n", FLOAT, x1+x2); //输出接收单词为小数 } } else //如果从输入文件接收的第一个字符既不是字母又不是数字 switch(ch) { //将所接收到的符号字符进行分类,采取一符一类 case':': ch=fgetc(fin); if(ch=='=') fprintf(fout,"(%d,:=)\n", EVALU); //输出接收符号为赋值号 else { fseek(fin,-1,1); //文件接收字符回推一个字符 fprintf(fout,"(%d,':')\n", COLON); //输出冒号 } break; case',': fprintf(fout,"(%d,',')\n", COMMA); break; //输出逗号 case'.': fprintf(fout,"(%d,'.')\n", ENDF); break; //输出句号 case';': fprintf(fout,"(%d,'.')\n", SEMIC); break; //输出分号 case'+': fprintf(fout,"(%d,'+')\n", ADD); break; //输出加号 case'-': fprintf(fout,"(%d,'-')\n", MINUS); break; //输出减号 case'*': fprintf(fout,"(%d,'*')\n", MULTI); break; //输出乘号 case'<': ch=fgetc(fin); if(ch=='=')fprintf(fout,"(%d,'<=')\n", LE); //输出小于或等于号 else if(ch=='>')fprintf(fout,"(%d,'<>')\n", NE); //输出不等于号 else { fseek(fin,-1,1); fprintf(fout,"(%d,'<')\n", LT);; //输出小于号 } break; case'=': fprintf(fout,"(%d,'=')\n", EQ); break; //输出等于号 case'>': ch=fgetc(fin); if(ch=='=')fprintf(fout,"(%d,'>=')\n", GE); //输出大于或等于号 else { fseek(fin,-1,1); fprintf(fout,"(%d,'>')\n", GT); //输出大于号 } break; case' ': break; case'\n': break; case'\t': break; case'/': ch=fgetc(fin);//单行注释 if(ch=='/') { while( (ch=fgetc(fin))!='\n') { ch=fgetc(fin) ; } } else { fseek(fin,-1,1); printf("/ is error\n"); //接收非上述字符程序报告词法错误 error++; } break; case'{': while(1) { ch=fgetc(fin); if(ch=='}') break; else if(ch==EOF) { fseek(fin,-1,1); printf("{ is error\n"); error++; break; } } break; default: printf("%c is error\n", ch); //接收非上述字符程序报告词法错误 error++; break; } ch=fgetc(fin); //继续从文件中读取下一个单词,直到文件结束 }//while循环结束 printf("共发现%d 个词法错误!",error); return;}int lookup(char *token){ int j; char word[norw][al]; strcpy(&(word[1][0]), "begin"); strcpy(&(word[2][0]), "end"); strcpy(&(word[3][0]), "var"); strcpy(&(word[4][0]), "integer"); strcpy(&(word[5][0]), "while"); strcpy(&(word[6][0]), "do"); strcpy(&(word[7][0]), "if"); strcpy(&(word[8][0]), "then"); strcpy(&(word[9][0]), "procedure"); strcpy(&(word[10][0]), "else"); for(j=1; j<=norw-1; j++)if(strcmp(token,word[j])==0) return j; //以TOKEN字符串查保留字表,若查到返回保留字类别码 return 0; //TOKEN不是保留字,返回0}bool isalpha(char c){ //判断接收字符是否为字母 if((c>='a'&&c<='z')||(c>='A'&&c<='Z'))return 1; else return 0;}bool isalnum(char c){ //判断接收字符是否为字母或者数字 if((c>='a'&&c<='z')||(c>='A'&&c<='Z')||(c>='0'&&c<='9'))return 1; else return 0;}bool isdigit(char c){ //判断接收字符是否为数字 if(c>='0'&&c<='9')return 1; else return 0;}int main(){ char filename[20]; printf("请输入文件名:"); scanf("%s",filename); if((fin=fopen(filename,"r"))==NULL) //打开要读取的文本文件 { printf("不能打开文件.\n"); exit(0); } printf("请输入保存分析结果的文件名:"); scanf("%s",filename); if((fout=fopen(filename,"w"))==NULL) { printf("不能打开文件.\n"); exit(0); } scanner(); //调用词法分析程序 getchar(); getchar(); fclose(fin); fclose(fout); return 0;}
这个主要用于测试写博客,以后会经常更新个人博客
- 词法分析
- 词法分析
- 词法分析
- 词法分析
- 词法分析
- 词法分析
- 词法分析
- 词法分析
- 词法分析
- 词法分析
- 词法分析
- 词法分析
- 词法分析
- 词法分析
- 词法分析
- 词法分析
- 词法分析
- 词法分析
- Java动态代理
- 搭建Hexo博客
- HDU
- hdu2604 queuing(dp+矩阵倍增)
- ArrayMaxTwoNum
- 词法分析
- 待解决:如何打开lazarus中math.pp下FPDOC_MATH编译选项
- JAVA设计模式之访问者模式
- bzoj2875 [noi2012]随机数生成器(矩阵倍增)
- ICML17 Seq2Seqtutorial精品资料分享
- Python中的模块学习之mock模块
- [LeetCode]92. Reverse Linked List II
- BigIntegerAdd
- poj 3211 Washing Clothes(分组01背包)