学年 第 学期
《编译原理》实验报告
学院(系): 计算机科学与工程学院 班 级: 11303070A
学 号: 11303070*** 姓 名: 无名氏 指导教师: 保密式
时 间: 2016 年 7 月
目录
1.实验目的 .............................................. 1 2.实验内容及要求 ........................................ 1 3.实验方案设计 .......................................... 1
3.1 编译系统原理介绍 ................................. 1
3.1.1 编译程序介绍 ................................ 2 3.1.2 对所写编译程序的源语言的描述 ................ 2 3.2 词法分析程序的设计 ................................ 3 3.3 语法分析程序设计 .................................. 4 3.4 语义分析和中间代码生成程序的设计 .................. 4 4. 结果及测试分析 ........................................ 4
4.1软件运行环境及限制 ................................ 4 4.2测试数据说明 ...................................... 5 4.3运行结果及功能说明 ................................ 5 5.总结及心得体会 ........................................ 7
1.实验目的
根据Sample语言或者自定义的某种语言,设计该语言的编译前端。包括词法分析,语法分析、语义分析及中间代码生成部分。
2.实验内容及要求
(1)词法分析器
输入源程序,输出对应的token表,符号表和词法错误信息。按规则拼单词,并转换成二元形式;滤掉空白符,跳过注释、换行符及一些无用的符号;进行行列计数,用于指出出错的行列号,并复制出错部分;列表打印源程序;发现并定位词法错误;
(2)语法分析器
输入token串,通过语法分析,寻找其中的语法错误。要求能实现Sample 语言或自定义语言中几种最常见的、基本的语法单位的分析:算术表达式、布尔表达式、赋值语句、if语句、for语句、while语句、do while语句等。
(3)语义分析和中间代码生成
输入token串,进行语义分析,修改符号表,寻找其中的语义错误,并生 成中间代码。要求能实现Sample语言或自定义语言中几种最常见的、基本的语法单位的分析:算术表达式、布尔表达式、赋值语句、if语句、for语句、while语句、do while语句等。
实验要求:功能相对完善,有输入、输出描述,有测试数据,并介绍不足。
3.实验方案设计
3.1 编译系统原理介绍
编译器逐行扫描高级语言程序源程序,编译的过程如下: (1). 词法分析
识别关键字、字面量、标识符 (变量名、数据名)、运算符、注释行(给人看的,一般不处理)、特殊符号(续行、语句结束、数组)等六类符号,分别归类等待处理。
(2). 语法分析
一个语句看作一串记号 (Token)流,由语法分析器进行处理。按照语言的文法检查判定是否是合乎语法的句子。如果是合法句子就以内部格式保存,否则报错。直至检查完整个程序。
(3). 语义分析
语义分析器对各句子的语法做检查:运算符两边类型是否相兼容;该做哪些类型转换 (例如,实数向整数赋值要\取整\;控制转移是否到不该去的地方;是
1
否有重名或者使语义含糊的记号,等等。如果有错误,则转出错处理,否则可以生成执行代码。
(4). 中间代码生成
中间代码是向目标码过渡的一种编码,其形式尽可能和机器的汇编语言相似,以便下一步的代码生成。但中间码不涉及具体机器的操作码和地址码。采用中间码的好处是可以在中间码上做优化。
(5). 优化
对中间码程序做局部优化和全局 (整个程序)优化,目的是使运行更快,占用空间最小。局部优化是合并冗余操作,简化计算,例如x:=0可用一条\清零\指令替换。全局优化包括改进循环、减少调用次数和快速地址算法等。
(6). 代码生成
由代码生成器生成目标机器的目标码 (或汇编)程序,其中包括数据分段、选定寄存器等工作,然后生成机器可执行的代码。 3.1.1 编译程序介绍
编译程序是指把用高级程序设计语言书写的源程序,翻译成等价的机器语言格式目标程序的翻译程序。编译程序属于采用生成性实现途径实现的翻译程序。它以高级程序设计语言书写的源程序作为输入,而以汇编语言或机器语言表示的目标程序作为输出。编译出的目标程序通常还要经历运行阶段,以便在运行程序的支持下运行,加工初始数据,算出所需的计算结果。 3.1.2 对所写编译程序的源语言的描述
Sample语言是一种类PASCAL语言,他以赋值语句为基础,包括顺序、条件和循环三种结构。有变量说明和常量说明,有多种数据类型、如整型、实型、字符型等。它包括如下一些语法成分:
(1). 数据类型:整型、布尔型、实型和字符类型。 (2). 表达式:可进行算术、布尔表达式的运算。 (3). 说明语句:常量说明(用const定义)、变量说明(用var定义)。 (4). 赋值语句。
(5). 控制语句:if语句、while语句,repeat语句和for循环语句。 (6). Begin … end复合语句。
(7). 程序(program)语句和结束(end.)语句。
2
3.2 词法分析程序的设计
初始化打开源文件源程序结束一行一行地处理用str[i]存储读到的每个单词结束根据第一个字符进行分类字母识别数值常数isdigit(str[i])识别运算符isoperator(str[i])识别标识符 /关键字处理注释和除号识别界符isbound(str[i])Y是关键字?在界符表中?NY在符号表中?NN注释号Y出错处理error插入到符号表中图 1 词法分析总流程
词法分析将源程序读入一个个的字符,根据一定的构词规则,识别出各类有用的单词。当输入字母时,开始识别标识符或关键宇,边拼写边从缓冲区读入下一符号,当读入一非字母数字符号时,标识符识别完成,但已多读入一个符号,所以列记数回退。然后查关键字表,判断拼出的符号串是否为关键字。若是关键字,输出其种别码。否则识别的单词就是标识符,同时输出标识符及其种别码。当输入数字时,开始识别整数或实数。边拼写边读入下一符号,当遇到“.”时,还要继续拼写该常数(实数情况)。如果遇到E,要识别带指数的常数,当遇到其它非数字符号时,数字常数拼写完毕,列计数也要退1。输出常数及其种别码。当输入“/”时,开始识别注解或除号,若是注解时,最后两个连续读出的符号是“*/”,不需再读下一符号,列计数不变。当判定是除号“/”时,已多读入一字符,列计数—1,输出“/”的种别码。
3