表II 包含语义处理过程的识别无符号数的状态矩阵
程序二 单词分类码为UCON的无符号数的识别程序
1 #include
5 #define DIGIT 1 6 #define POINT 2 7 #define OTHER 3 8 #define POWER 4 9 #define PLUS 5 10 #define MINUS 6
11 #define UCON 7 //Suppose the class number of unsigned constant is 7 12 #define ClassOther 200 13 #define EndState -1 14 int w,n,p,e,d;
15 int Class; //Used to indicate class of the word 16 int ICON; 17 float FCON;
18 static int CurrentState; //Used to present current state, the initial value:0 19
20 int GetChar (void); 21 int EXCUTE (int,int); 22 int LEX (void);
23 int HandleOtherWord (void) 24 {return ClassOther; 25 }
26 int HandleError (void)
27 {printf (\\n\28
29 int GetChar (void) 30 {
31 int c;
32 c=getchar ( );
33 if(isdigit(c)) {d=c-′0′;return DIGIT;} 34 if (c==′.′) return POINT;
35 if (c==′E′||c==′e′) return POWER; 36 if (c==′+′) return PLUS; 37 if (c==′-′) return MINUS; 38 return OTHER; 39 }
40 int EXCUTE (int state, int symbol) 41 {
42 switch (state) 43 {
44 case 0:switch (symbol) 45 {
46 case DIGIT: n=0;p=0;e=1;w=d;CurrentState=1;Class=UCON;break; 47 case POINT: w=0;n=0;p=0;e=1;CurrentState=3;Class=UCON;break; 48 default: HandleOtherWord( );Class=ClassOther; 49 CurrentState=EndState; 50 }
51 break;
52 case 1:switch (symbol) 53 {
54 case DIGIT: w=w*10+d;break; //CurrentState=1 55 case POINT: CurrentState=2;break; 56 case POWER: CurrentState=4;break; 57 default: ICON=w;CurrentState=EndState; 58 }
59 break;
60 case 2:switch (symbol) 61 {
62 case DIGIT: n++;w=w*10+d;break; 63 case POWER: CurrentState=4;break;
64 default: FCON=w*pow(10,e*p-n);CurrentState=EndState; 65 }
66 break;
67 case 3:switch (symbol) 68 {
69 case DIGIT: n++;w=w*10+d;CurrentState=2;break; 70 default: HandleError( );CurrentState=EndState; 71 }
72 break;
73 case 4:switch (symbol) 74 {
75 case DIGIT: p=p*10+d;CurrentState=6;break; 76 case MINUS: e=-1;CurrentState=5;break; 77 case PLUS: CurrentState=5;break;
78 default: HandleError( );CurrentState=EndState; 79 }
80 break;
81 case 5:switch (symbol) 82 {
83 case DIGIT: p=p*10+d;CurrentState=6;break; 84 default: HandleError( );CurrentState=EndState; 85 }
86 break;
87 case 6:switch (symbol) 88 {
89 case: DIGIT:p=p*10+d;break;
90 default: FCON=w*pow(10,e*p-n);CurrentState=EndState; 91 }
92 break; 93 }
94 return CurrentState; 95 }
96 int LEX (void) 97 {
98 int ch;
99 CurrentState=0;
100 while (CurrentState!=EndState) 101 {
102 ch=GetChar( );
103 EXCUTE (CurrentState,ch); 104 }
105 return Class; 106 }
实验二 语法分析程序实现
一、实验目的与要求
通过设计、编制、调试一个典型的语法分析程序(任选一种有代表性的语法分析方法,如算符优先法、递归下降法、LL(1)、SLR(1)、LR(1)等,作为编制语法分析程序的依据),对实验一所得扫描器提供的单词序列进行语法检查和结构分析,实现并进一步掌握常用的语法分析方法。
二、一般实现方法说明
为了在对源程序的一遍扫描过程中,同时完成词法和语法分析任务,应注意修改实验一中的词法分析程序,将它编写为子程序的形式,以便供语法分析程序调用。另外,应加强错误检查,对输入符号串中的词法、语法错误,给出必要的说明信息,尽可能多地、确切地指出错误的位置、原因和性质。例如,在词法分析阶段,对当前正在处理的字符ch,可进一步定义一些与该字符相关的信息row和col,分别表示该字符所在的行和列,这些内容在出错处理时用来提供和源程序位置相关的信息。即定义:
char ch; /*The current character*/
int row; /*The line number position of the current character*/ int col; /*The column number position of the current character*/
三、实验内容
基本实验题目:选择对各种常见高级程序设计语言都较为通用的语法结构——算术表达式的一个简化子集——作为分析对象,根据如下描述其语法结构的BNF定义G2[<算术表达式>],任选一种学过的语法分析方法,针对运算对象为无符号常数和变量的四则运算,设计并实现一个语法分析程序。
G2[<算术表达式>]:
<算术表达式> → <项> | <算术表达式>+<项> | <算术表达式>-<项> <项> → <因式> | <项>*<因式> | <项>/<因式> <因式> → <运算对象> | (<算术表达式>)
若将语法范畴<算术表达式>、<项>、<因式>和<运算对象>分别用E、T、F和i代表,则G2可写成:
G2[E]:E → T | E+T | E-T T → F | T*F | T/F F → i | (E)
输入:由实验一输出的单词串,例如:UCON,PL,UCON,MU,ID ······
输出:若输入源程序中的符号串是给定文法的句子,则输出“RIGHT”,并且给出每一步分析过程;若不是句子,即输入串有错误,则输出“ERROR”,并且显示分析至此所得的中间结果,如分析栈、符号栈中的信息等,以及必要的出错说明信息。
扩展实验:对所给算术表达式的文法G2,完成两种以上不同的语法分析程序的设计与实现;或在G2的基础上,适当增加功能,如进一步选择高级语言中的赋值语句、复合语句、流程控制语句等其它类型的语法结构作为分析对象。
四、要求
1、上机前的准备:结合题目的要求,确定语法分析程序的流程图,同时考虑相应的数据结构,用C或其它高级语言初步编写一个语法分析源程序。
2、调试:将词法、语法分析合在一起构成一个完整的程序,并调试成功。 3、测试:供测试的例子应包括符合语法规则的语句,及分析程序能判别的若干错例。 4、结果输出:对于所输入的字符串,不论对错,都应有明确的信息告诉外界。 5、编写的源程序中应有较为详细的说明和注释。例如,对文法机内表示的解释、数据结构的说明、函数的作用、全局变量的含义等等。
五、参考实现方法
下面分别简要给出基于递归下降法、预测分析法、算符优先法、SLR(1)四种语法分析程序的开发方法示例说明,仅供参考。
1、示例一:采用具有递归功能的高级语言编制递归下降法的语法分析程序。 运算对象i可以进一步定义为变量、常数等,例如,此处将i定义为:
i→<变量> <变量>→<标识符> <标识符>→<字母> <字母>→A|B|C|…|X|Y|Z
利用扩充的BNF消除G2[E]中E和T的直接左递归后,采用递归下降法分析上述算术表达式的框图见图3。其中ZC过程为总控程序,被设计成可以分析无穷多个算术表达式,主要完成:①通知外界键入算术表达式。②控制E过程分析算术表达式。③根据分析结果之正误,分别输出不同的信息。E、T和F三个过程分别对应<算术表达式>、<项>和<因式>三个产生式的处理。它们都利用到一个公共过程ADVANCE。ADVANCE过程负责从输入字符串ST中取出下一个字符,并存入SYM中等待分析;然后再剔除ST中的首字符,这可通过挪动字符串指针的办法来实现(而实际上是通过调用词法分析程序来实现ADVANCE功能的)。变量TZ之值标志分析的结果,表明表达式是否有错。