实验1 词法分析程序的设计与开发

编译原理实验报告

课程名称: 编译原理

班级: 计算1614

实验成绩:

指导教师: 付永钢 姓名: 施心萍 实验项目名称: 学号: 201621121097 上机实践日期: 实验一 词法分析程序设计与开发

一、实验目的

? 深入理解有限自动机及其应用 ? 掌握词法分析程序的开发。

? 掌握根据语言的词法规则构造识别其单词的有限自动机的方法 ? 深入理解词法分析程序自动生成原理

二、实验要求

? 掌握各类单词的形式描述

?用直接转向法实现有限自动机的代码编写。 ? 独立完成PL0语言的词法分析器。

? 掌握词法分析程序自动生成工具LEX的使用。

三、实验原理

词法分析是编译过程的第一阶段。它的任务就是对输入的字符串形式的源程序按顺序进行扫描,根据源程序的词法规则识别具有独立意义的单词(符号),并输出与其等价的Token序列。

有限自动机是描述程序设计语言单词构成的工具,而状态转换图是有限自动机的比较直观的描述方法。我们使用确定的有限状态自动机,简记为DFA。

PL/0的语言的词法分析器将要完成以下工作: (1) 跳过分隔符(如空格,回车,制表符); (2) 识别诸如begin,end,if,while等保留字;

(3) 识别非保留字的一般标识符,此标识符值(字符序列)赋给全局量id,而全局量sym赋值为SYM_IDENTIFIER。

(4) 识别数字序列,当前值赋给全局量NUM,sym则置为SYM_NUMBER; (5) 识别:=,<=,>=之类的特殊符号,全局量sym则分别被赋值为SYM_BECOMES,SYM_LEQ,SYM_GEQ等。

入口 S 字母 标识符状态, INID 数字 数字状态, INNUM 字母,数字 标识符 数字 无符号整数 + , - , * , / , ( , ) , ; , [ , ] , = , <,EOF,空白 完成状态, DONE 其它符号 出错 : = 赋值状态INASSIGN 字母,数字 { 注释状态, INCOMMENT } 注释 注释结束 双分界符 单分界符 “ 字母或数字 其它符号 “ 出错 字符串 字符串状态, INCHAR 完成状态DONE 其他 出错 出口 识别PL0单词的DFA表示 相关过程(函数)有getsym(),getch(),其中getch()为获取单个字符的过程,除此之外,它还完成:

(1) 识别且跳过行结束符;

(2) 将输入源文件复写到输出文件;

(3) 产生一份程序列表,输出相应行号或指令计数器的值。 下面给出能够识别PL0语言中各类单词的DFA:

根据语言的词法规则构造出识别其单词的确定有限自动机DFA, 仅仅是词法分析程序的一个形式模型,距离词法分析程序的真正实现还有一定的距离。状态转换图的程序实现通常是采用直接转向法。

直接转向法又称为程序中心法,是把状态转换图看成一个流程图,从状态转换图的初态开始,对它的每一个状态结点都编写一段相应的程序。

四、实验步骤

一、构造识别单词的自动机

1.根据给定的词法构成规则对程序语言的单词按类构造出相应的状态转换图,并根据具体需求对该状态转换图进行完善。

2. 对各类单词的状态转换图合并,构成一个能识别语言所有单词的状态转换图。合并步骤为:

(1) 将各类单词的状态转换图的初始状态合并为一个唯一的初态; (2) 化简调整状态冲突和对冲突状态重新编号;

(3) 对上述形成的状态图进行修正,以满足识别合适单词的要求。 (4) 如有必要,在合适的位置增加出错状态。

二、用直接转向法实现有限自动机的代码,生成对应的词法分析程序。要

严格按照给出的DFA,对每个状态编写对应的识别代码,然后对每个状态的代码用合适的分支、循环等语句进行整合,完成整个代码的合成工作,并上机进行调试。对实现的代码进行测试,给出合适的测试用例(要求至少有3个用例,二个正确识别所有的保留字、标识符、分界符、数字等;另外一个识别错误的单词。

1. 样例1 输入

联系客服:779662525#qq.com(#替换为@) 苏ICP备20003344号-4