(2) setnull (exp) //串exp初始化为空串。
(3) ch in opset //判取出字符是否是操作符。
(4) push (s,ch) //如ch是运算符,则入运算符栈s。 (5) sempty (s) //判栈s是否为空。
(6) succ := false //若读出ch是操作数且栈为空,则按出错处理。
(7) exp (8)ch //若ch是操作数且栈非空,则形成部分中缀表达式。 (9) exp (10) gettop(s) //取栈顶操作符。 (11) pop(s) //操作符取出后,退栈。
(12) sempty(s) //将pre的最后一个字符(操作数)加入到中缀式exp的最
后。
四.应用题
1.串是零个至多个字符组成的有限序列。从数据结构角度讲,串属于线性结构。与线性表的特殊性在于串的元素是字符。
2.空格是一个字符,其ASCII码值是32。空格串是由空格组成的串,其长度等于空格的个数。空串是不含任何字符的串,即空串的长度是零。 3.最优的T(m,n)是O(n)。串S2是串S1的子串,且在S1中的位置是1。开始求出最大公共子串的长度恰是串S2的长度,一般情况下,T(m,n) =O(m*n)。 4.朴素的模式匹配(Brute-Force)时间复杂度是O(m*n),KMP算法有一定改进,时间复杂度达到O(m+n)。本题也可采用从后面匹配的方法,即从右向左扫描,比较6次成功。另一种匹配方式是从左往右扫描,但是先比较模式串的最后一个字符,若不等,则模式串后移;若相等,再比较模式串的第一个字符,若第一个字符也相等,则从模式串的第二个字符开始,向右比较,直至相等或失败。若失败,模式串后移,再重复以上过程。按这种方法,本题比较18次成功。
5.KMP算法主要优点是主串指针不回溯。当主串很大不能一次读入内存且经常发生部分匹配时,KMP算法的优点更为突出. 6.模式串的next函数定义如下: next[j]
=
根据此定义,可求解模式串t的next和nextval值如下:
j t串 next[j] nextval[j] 1 2 3 4 5 6 7 8 9 10 11 12 a b c a a b b a b c a b 0 1 1 1 2 2 3 1 2 3 4 5 0 1 1 0 2 1 3 0 1 1 0 5
7.解法同上题6,其next和nextval值分别为0112123422和0102010422。 8.解法同题6,t串的next和nextval函数值分别为0111232和0110132。 9.解法同题6,其next和nextval 值分别为011123121231和011013020131。 10.p1的next和nextval值分别为:0112234和0102102;p2的next和nextval值分别为:0121123和0021002。
11.next数组值为011234567 改进后的next数组信息值为010101017。
12.011122312。
13.next定义见题上面6和下面题20。串p的next函数值为:01212345634。 14.(1)S的next与nextval值分别为012123456789和002002002009,p的next与nextval值分别为012123和002003。
(2)利用BF算法的匹配过程: 利用KMP算法的匹配过程: 第一趟匹配: aabaabaabaac 第一趟匹配:aabaabaabaac aabaac(i=6,j=6) aabaac(i=6,j=6) 第二趟匹配: aabaabaabaac 第二趟匹配:aabaabaabaac aa(i=3,j=2) (aa)baac 第三趟匹配: aabaabaabaac 第三趟匹配:aabaabaabaac
a(i=3,j=1) (成功) (aa)baac
第四趟匹配: aabaabaabaac
aabaac(i=9,j=6)
第五趟匹配: aabaabaabaac
aa(i=6,j=2)
第六趟匹配: aabaabaabaac
a(i=6,j=1)
第七趟匹配: aabaabaabaac
(成功) aabaac(i=13,j=7) 15.(1)p的nextval函数值为0110132。(p的next函数值为0111232)。
(2)利用KMP(改进的nextval)算法,每趟匹配过程如下: 第一趟匹配: abcaabbabcabaacbacba abcab(i=5,j=5)
第二趟匹配: abcaabbabcabaacbacba abc(i=7,j=3) 第三趟匹配: abcaabbabcabaacbacba a(i=7,j=1)
第四趟匹配: abcaabbabcabaac bacba (成功) abcabaa(i=15,j=8) 16.KMP算法的时间复杂性是O(m+n)。
p的next和nextval值分别为01112212321和01102201320。 17.(1)p的nextval函数值为01010。(next函数值为01123)
(2)利用所得nextval数值,手工模拟对s的匹配过程,与上面16题类似,为节省篇
幅,故略去。
18.模式串T的next和nextval值分别为0121123和0021002。
19.第4行的p[J]=p[K]语句是测试模式串的第J个字符是否等于第K个字符,如是,则指针J和K均增加1,继续比较。第6行的p[J]=p[K]语句的意义是,当第J个字符在模式匹配中失配时,若第K个字符和第J个字符不等,则下个与主串匹配的字符是第K个字符;否则,若第K个字符和第J个字符相等,则下个与主串匹配的字符是第K个字符失配时的下一个(即NEXTVAL[K])。
2
该算法在最坏情况下的时间复杂度O(m)。 20.(1)当模式串中第一个字符与主串中某字符比较不等(失配)时,next[1]=0表示模式串中已没有字符可与主串中当前字符s[i]比较,主串当前指针应后移至下一字符,再和模式串中第一字符进行比较。
(2)当主串第i个字符与模式串中第j个字符失配时,若主串i不回溯,则假定模式串第k个字符与主串第i个字符比较,k值应满足条件1 (3)在上面两种情况外,发生失配时,主串指针i不回溯,在最坏情况下,模式串从第1个字符开始与主串第i个字符比较,以便不致丢失可能的匹配。 21.这里失败函数f,即是通常讲的模式串的next函数,其定义见本章应用题的第6题。 进行模式匹配时,若主串第i个字符与模式串第j个字符发生失配,主串指针i不回溯,和主串第i个字符进行比较的是模式串的第next[j]个字符。模式串的next函数值,只依赖于模式串,和主串无关,可以预先求出。 该算法的技术特点是主串指针i不回溯。在经常发生“部分匹配”和主串很大不能一次调入内存时,优点特别突出。 22.失败函数(即next)的值只取决于模式串自身,若第j个字符与主串第i个字符失配时,假定主串不回溯,模式串用第k(即next[j])个字符与第i个相比,有‘ p1?pk-1’=‘pj-k+1?pj-1’,为了不因模式串右移与主串第i个字符比较而丢失可能的匹配,对于上式中存在的多个k值,应取其中最大的一个。这样,因j-k最小,即模式串向右滑动的位数最小,避免因右移造成的可能匹配的丢失。 23.仅从两串含有相等的字符,不能判定两串是否相等,两串相等的充分必要条件是两串长度相等且对应位置上的字符相同(即两串串值相等)。 24.(1)s1和s2均为空串;(2)两串之一为空串;(3)两串串值相等(即两串长度相等且对应位置上的字符相同)。(4)两串中一个串长是另一个串长(包括串长为1仅有一个字符的情况)的数倍,而且长串就好象是由数个短串经过连接操作得到的。 25、题中所给操作的含义如下: //:连接函数,将两个串连接成一个串 substr(s,i,j):取子串函数,从串s的第i个字符开始,取连续j个字符形成子串 replace(s1,i,j,s2):置换函数,用s2串替换s1串中从第i个字符开始的连续j个字符 本题有多种解法,下面是其中的一种: (1) s1=substr(s,3,1) //取出字符:‘y’ (2) s2=substr(s,6,1) //取出字符:‘+’ (3) s3=substr(s,1,5) //取出子串:‘(xyz)’ (4) s4=substr(s,7,1) //取出字符:‘*’ (5) s5=replace(s3,3,1,s2)//形成部分串:‘(x+z)’ (6) s=s5//s4//s1 //形成串t即‘(x+z)*y’ 五、算法设计 1、[题目分析]判断字符串t是否是字符串s的子串,称为串的模式匹配,其基本思想是对串s和t各设一个指针i和j,i的值域是0..m-n,j的值域是0..n-1。初始值i和j均为0。模式匹配从s0和t0开始,若s0=t0,则i和j指针增加1,若在某个位置si!=tj,则主串指针i回溯到i=i-j+1,j仍从0开始,进行下一轮的比较,直到匹配成功(j>n-1),返回子串在主串的位置(i-j)。否则,当i>m-n则为匹配失败。 int index(char s[],t[],int m,n) //字符串s和t用一维数组存储,其长度分别为m和n。本算法求字符串t在字符串s中的第一次出现,如是,输出子串在s中的位置,否则输出0。 {int i=0,j=0; while (i<=m-n && j<=n-1) if (s[i]==t[j]){i++;j++;} //对应字符相等,指针后移。 else {i=i-j+1;j=0;} //对应字符不相等,I回溯,j仍为0。 if(i<=m-n && j==n) {printf(“t在s串中位置是%d”,i-n+1);return(i-n+1);}//匹配成功 else return(0); //匹配失败 }//算法index结束 main ()//主函数 {char s[],t[]; int m,n,i; scanf(“%d%d”,&m,&n); //输入两字符串的长度 scanf(“%s”,s); //输入主串 scanf(“%s”,t); //输入子串 i=index(s,t,m,n); }//程序结束 [程序讨论]因用C语言实现,一维数组的下标从0开始,m-1是主串最后一个字符的下标,n-1是t串的最后一个字符的下标。若匹配成功,最佳情况是s串的第0到第n-1个字符与t匹配,时间复杂度为o(n);匹配成功的最差情况是,每次均在t的最后一个字符才失败,直到s串的第m-n个字符成功,其时间复杂度为o((m-n)*n),即o(m*n)。失败的情况是s串的第m-n个字符比t串某字符比较失败,时间复杂度为o(m*n)。之所以串s的指针i最大到m-n,是因为在m-n之后,所剩子串长度已经小于子串长度n,故不必再去比较。算法中未讨论输入错误(如s串长小于t串长)。 另外,根据子串的定义,返回值i-n+1是子串在主串中的位置,子串在主串中的下标是i-n。 2.[问题分析]在一个字符串内,统计含多少整数的问题,核心是如何将数从字符串中分离出来。从左到右扫描字符串,初次碰到数字字符时,作为一个整数的开始。然后进行拼数,即将连续出现的数字字符拼成一个整数,直到碰到非数字字符为止,一个整数拼完,存入数组,再准备下一整数,如此下去,直至整个字符串扫描到结束。 int CountInt() // 从键盘输入字符串,连续的数字字符算作一个整数,统计其中整数的个数。 {int i=0,a[]; // 整数存储到数组a,i记整数个数 scanf(“%c”,&ch);// 从左到右读入字符串 while(ch!=‘#’) //‘#’是字符串结束标记 if(isdigit(ch))// 是数字字符 {num=0; // 数初始化 while(isdigit(ch)&& ch!=‘#’)// 拼数 {num=num*10+‘ch’-‘0’; scanf(“%c”,&ch); } a[i]=num;i++; if(ch!=‘#’)scanf(“%c”,&ch); // 若拼数中输入了‘#’,则不再输入 }// 结束while(ch!=‘#’) printf(“共有%d个整数,它们是:”i); for(j=0;j {printf(“m”,a[j]); if((j+1)%10==0)printf(“\\n”);} // 每10个数输出在一行上 }// 算法结束 [算法讨论]假定字符串中的数均不超过32767,否则,需用长整型数组及变量。 3、[题目分析]设以字符数组s表示串,重复子串的含义是由一个或多个连续相等的字符组成的子串,其长度用max表示,初始长度为0,将每个局部重复子串的长度与max相比,若比max大,则需要更新max,并用index记住其开始位置。 int LongestString(char s[],int n) //串用一维数组s存储,长度为n,本算法求最长重复子串,返回其长度。 {int index=0,max=0; //index记最长的串在s串中的开始位置,max记其长度 int length=1,i=0,start=0; //length记局部重复子串长度,i为字符数组下标 while(i if(s[i]==s[i+1]) {i++; length++;} else //上一个重复子串结束 {if(max i++;start=i;length=1; //初始化下一重复子串的起始位置和长度 } printf(“最长重复子串的长度为%d,在串中的位置%d\\n”,max,index); return(max); }//算法结束 [算法讨论]算法中用i 算法的时间复杂度为O(n),每个字符与其后继比较一次。 4、[题目分析]教材中介绍的串置换有两种形式:第一种形式是replace(s,i,j,t),含义是将s串中从第i个字符开始的j个字符用t串替换,第二种形式是replace(s,t,v),含义是将s串中所有非重叠的t串用v代替。我们先讨论第一种形式的替换。因为已经给定顺序存储结构,我们可将s串从第(i+j-1)到串尾(即s.curlen)移动t.curlen-j绝对值个位置(以便将t串插入):若j>t.curlen,则向左移;若j int replace(strtp s,t,int i,j) //s和t是用一维数组存储的串,本算法将s串从第i个字符开始的连续j个字符用t串置换,操作成功返回1,否则返回0表示失败。 {if(i<1 || j<0 || t.curlen+s.curlen-j>maxlen) {printf(“参数错误\\n”);exit(0);} //检查参数及置换后的长度的合法性。 if(j for(k=0;k