编译原理实验报告
实验名称 Chomsky文法类型判断
实验时间 2014.04.02
院系 计算机科学与技术学院
班级 XXXXXXXXX
学号 XXXXXXX
姓名 XXXX
1
1.试验目的:
上机实验有助于我们发现理论课学习中无法发现的问题,通过上机实验操作,进一步加深对理论课所学的“Chomsky文法类型判断”的理解,同时提升自己的编程能力,为以后的学习打下良好的基础。
2.实验原理
① 0型文法(短语文法)
如果对于某文法G,P中的每个规则具有下列形式: u -> v
其中u∈V+,v∈V*,则称该文法G为0型文法或短语文法,简写为PSG。 0型文法或短语结构文法的相应语言称为0型语言或短语结构语言L0。这种文法由于没有其他任何限制,因此0型文法也称为无限制文法,其相应的语言称为无限制性语言。任何0型语言都是递归可枚举的,故0型语言又称递归可枚举集。这种语言可由图灵机(Turning)来识别。
② 1型文法(上下文有关文法)
如果对于某文法G,P中的每个规则具有下列形式: xUy -> xuy
其中U∈VN;u∈V+;x,y∈V*,则称该文法G为1型文法或上下文有关文法,也称上下文敏感文法,简写为CSG。
1型文法的规则左部的U和右部的u具有相同的上文x和下文y,利用该规则进行推导时,要用u替换U,必须在前面有x和后面有y的情况下才能进行,显示了上下文有关的特性。
1型文法所确定的语言为1型语言L1,1型语言可由线性有界自动机来识别。
③ 2型文法(上下文无关文法)
如果对于某文法G,P中的每个规则具有下列形式: U -> u
其中U∈VN;u∈V+,则称该文法G为2型文法或上下文无关文法,简写为CFG。
按照这条规则,对于上下文无关文法,利用该规则进行推导时,无需考虑非终结符U所在的上下文,总能用u替换U,或者将u归约为U,显示了上下文无关的特点。
2型文法所确定的语言为2型语言L2,2型语言可由非确定的下推自动机来识别。
一般定义程序设计语言的文法是上下文无关的。如C语言便是如此。因此,上下文无关文法及相应语言引起了人们较大的兴趣与重视。
④ 3型文法(正则文法,线性文法)
如果对于某文法G,P中的每个规则具有下列形式: U -> T 或 U -> WT
其中T∈VT;U,W∈VN,则称该文法G为左线性文法。 如果对于某文法G,P中的每个规则具有下列形式:
2
U ->= T 或 U -> TW
其中T∈VT;U, W∈VN,则称该文法G为右线性文法。 左线性文法和右线性文法通称为3型文法或正则文法,有时又称为有穷状态文法,简写为RG。
按照定义,对于正则文法应用规则时,单个非终结符号只能被替换为单个终结符号,或被替换为单个非终结符号加上单个终结符号,或者被替换为单个终结符号加上单个非终结符号。
3型文法所确定的语言为3型语言L3,3型语言可由确定的有限状态自动机来识别。
在常见的程序设计语言中,多数与词法有关的文法属于3型文法。
可以看出,上述4类文法,从0型到3型,产生式限制越来越强,其后一类都是前一类的子集,而描述语言的功能越来越弱,四类文法及其表示的语言之间的关系可表示为:
0型?1型?2型?3型;即L0? L1? L2? L3
3.实验内容
输入:一组任意的规则。
输出:相应的Chomsky 文法的类型。 注意事项:⑴文法的输入应简便。
⑵指明是哪一类Chomsky文法,并给出相应的四元组形式: G=(VN,VT,P,S)。
说明:简单起见,可以不考虑0型文法类。
4.实验心得
本次实验,我最大的体会就是我们不仅要熟练地掌握书本上的知识,更重要的是能够把学到的知识应用到上机编程中,这样才能算是真正学会了书本上所讲的知识。
在编写代码的过程中,我发现自己对3型文法的概念没有理解清楚,认为在对某个3型文法进行判断时,可以同时使用左线性文法和右线性文法,结果实际测试的过程中发现了错误,后来向别的同学请教及时发现并改正了错误;在对文法的各个要素进行输入的过程中,我也遇到了问题,主要是各种输入非法的情况考虑不周全,后来经过改正,修改了自己发现的所有错误,并及时改正了在测试中发现的问题,但仍无法保证所有的边界情况都考虑周全,这也是本实验所欠缺的地方,以后我会继续努力。我想,学习是个持之以恒的过程,如果真正想学好编译原理的话,光靠实验课的时间是远远不够的,所以以后我一定要加强学习,坚持不懈,一切努力都是值得的。
3
5.实验代码与结果
本实验使用java语言编写,编程工具是eclipse,实验运行结果如下: ⑴几种非法输入测试
①产生式左部不含有非终结符:
②产生式的左部含有非法字符。
还有一些其他的非法输入,在此就不一一举例。
⑵正确的输入:
①数据一:(3型文法) G=({S, A, B}, {1, 2}, P, S) ,
P={S->1A, S->1, A->2B, B->1B, B->2S };
首先是数据的输入:
输入包括:非终结符集和终结符集的输入、产生式的个数、依次输入产生式的左部和右部以及开始符。
4
实验结果:
②数据二:(2型文法) G=({S}, {0, 1}, P , S) , P={ S->0S1, S->01 };
数据的输入:
5