东南大学硕士学位论文1.2字符识别研究简介1.2.1国内外研究概况字符识别系统是模式识别学科的重要研究领域。许多研究者在该领域开展了广泛的探索,促进了模式识别的发展。近十几年来。随着大规模集成电路和微电子技术的快速发展、计算机与其相关设备价格的迅速下降及性能的快速提升,我们所生活的社会进入了信息技术不断发展的时代,越来越多的人能够接触并利用计算机辅助完成他们的工作。人们对它的要求也日益提高,希望能够代替人类快速高效地完成一些劳动,比如对各种文献的阅读、翻译、查找、整理等。如果通过OCR系统实现机械化、自动化,不仅可以提高工作效率,节省大量的人力资源,同时可以避免人们在进行这些大量重复性劳动时可能出现的失误,提高正确率。字符识别系统是近来逐渐发展起来的一门自动化技术,涉及到模式识别、图像处理、模糊处理、组合论、信息论、计算机科学等多个学科,同时也涉及到语言文字学、心理学等学科,是一门综合的技术,广泛应用于排版、印刷、文件处理、表格阅读等办公自动化领域。随着全球经济一体化和计算机网络的发展,需要处理的英文资料也不断增多,英文字母的识别技术得到了突飞猛进的发展,许多基于手写字符识别技术的商品在社会上得以应用。光学字符识别技术的研究最初始于欧洲,德国人TauShek早在1929年就获得一项有关OCR的专利。为了把大量纸张文档上的文字信息电子化,并进一步利用计算机处理信息,欧美国家自1950年代起就开始OCR技术研究。在当时中、日、韩面临文字信息处理的关键问题是东方语言文字的识别,为此,日本在1970年代投入大量资金和人力,韩国于1990年代也开展了大量的OCR研究工作,中国的汉字识别研究始于1970年代末1980年代初。经过近一个世纪的发展,oCR技术已经成为当今模式识别领域中最活跃的研究内容之一。它综合了数字图像处理、计算机图形学和人工智能等多方面的知识,并在计算机及其相关领域中得到了广泛应用。字符识别分两种:一种是印刷体字符识别(PrintedcllaraCterrecogIlition),一种是手写字符识别(HandwrinenCh雅lcterR∞ogmtion)f2】。印刷体字符识别技术已经越来越受到人们的重视,比较典型的有邮政编码自动识别,印刷电路板、工业元器件字符标识识别及各种中英文OCR表格与文本识别处理。手写字符识别比印刷体字符识别复杂。OcR在人机交互中实际充当了人机界面的作用。日前,以wind0、ⅣS和鼠标为主的图形用户界面虽然给用户使用计算机带来了很大的便利,但其实质与命令行时代相比并没有本质变2第一章绪论化。随着信息化程度小断加j!;|{,传统界面f1益成为数捌交流的“瓶颈”。OCR【}Jj:更容易被人们接受、掌握,近几年来,同语音识别、行为识别等。起fj益成为人们研究的焦点。IBM、Motorola、HP和MicrosoR等公司都陆续展了F了这方而的研究。微软公卅最新推出的办公套件MicrosoR0伍ceXP中,不仅加强了对原有对手写输入的支持,还新增加了OCR工具组件。字符识别产品的J“泛应用推动了模式识别等相关理论的发展,促进了计算机应用的普及。经过几十年的发展,现在OCR技术取得了很多进展。无论是国内和国外都有了相对成熟的产品。传统的OCR产品主要解决文字自动录入的问题,现代:的OCR产品实际上已经成为了沟通现实世界和计算机世界的一座桥梁。越南从1998年开始越南字识别研究,到现在已经有几类应用软件如VnDOCR、TesSe嬲OCR、VietOCR,但识别技术还是有待进一步发展。VnDOCR是信息科学院一越南科技工艺院开发的。VnDOCR软件是一种印刷体越南字符识别软件,用神经网络识别越南字符,效果较好,字符识别成功率接近99%,处理速度比较快。到现在VnDOCRVersion4已有几十千个客户使用。另外,研究工作者已提出了许多越南手写字体识别的方法,能够识别各种字体,较好地解决了手写数字谚{别的难题。图卜l越南字符识别软什VnDoc4.0版3东南大学硕士学位论文1.2.2研究背景和理论意义在字符识别研究中使用最常用的方法是光学字符识别法,其中的统计模式识别方法注重数量特征,便于特征提取,分析和计算。很多研究人员都进行过OcR的研究工作,原因之一是字符便于处理,并且字符识别被认为是比较容易解决的问题。字符识别处理的信息可分为两大类:一类是文字信息,处理的主要是各国家、各民族的文字(如:汉字,英文等)书写或印刷的文本信息,目前在印刷体和联机手写方面技术己趋向成熟,并推出了很多应用系统;另一类是数据信息,主要是由阿拉伯数字及少量特殊符号组成的各种编号和统计数据,如:邮政编码、统计报表、财务报表、银行票据等等D3。在整个OcR领域中,最为困难的就是脱机手写字符的识别。到目前为止,尽管人们在脱机手写英文、汉字识别的研究中已取得很多可喜成就,但距实用还有一定距离。而在手写数字识别这个方向上。经过多年研究,研究工作者已经开始把它向各种实际应用推广,为手写数据的高速自动输入提供了一种解决方案。因为手写体识别比较复杂和困难,所以本文选择印刷体识别作为研究的第一步,以理解字符识别领域。印刷字体识别是模式识别领域的一项传统课题,有着重要的理论价值:1.阿拉伯数字是唯一被世界各国通用的符号,对印刷字体识别的研究基本上与文化背景无关,这样就为各国、各地区的研究者提供了一个施展才智的大舞台。在这一领域大家可以探讨,比较各种研究方法。2.由于字符识别的类别数不多,有助于做深入分析及验证一些新的理论。这方面最明显的例子就是人工神经网络(ANN)…~相当一部分的舢州模型和算法都以字符识别作为具体的实验平台,验证理论的有效性,评价各种方法的优缺点。3.尽管人们对字符识别己进行了长期研究,并已取得很多成果,但至今机器的识别本领还无法与人的认知能力相比,这仍是一个有难度的开放问题(Openproblem)。4.字符的识别方法很容易推广到其它一些相关问题,例如一个直接的应用是对英文这样的拼音文字的识别。事实上,很多学者就是把数字和英文字母的识别放在一块儿研究的。5.字符识别虽然在世界范围已经应用很广,但对越南字符识别还有待进一步发展。迄今为止,人类识别文字的能力远远胜于计算机,无论是变形的字符、模糊的字符,甚至是破损的字符,人类都能很好地识别。基于人工神经网络的字符识别技术,目的就是力图通过对人脑功能和结构的模拟来实现字符的高效识别。4第一苹绪论经过近几年的迅速发展,人工神经网络在字符识别方面得到了广泛的应用。在OCR系统中,人工神经网络主要充当分类器的功能[41。网络的输入是字符的特征向量,输出是字符的分类结果,即识别结果。由于识别策略的不同和对问题理解水平的限制,输入的特征向量所包含的信息常常是冗余的,甚至是矛盾的。经过反复学习,神经网络可以智能地将特征向量优化,去除冗余、矛盾的信息。其次,由于神经网络采用分布式的网络结构,本身具备可以并行的条件,可以加快大规模问题的求解速度。神经网络目前已经广泛地用来解决模式识别和人工智能领域的一些复杂问题。由于人工神经网络的非线性、并行性和鲁棒性等特点,取得了以往传统算法无法获得的成功。由于人工神经网络等新技术的引入,从1970年代以来,光学字符识别技术逐渐走向成熟。对于脱机印刷体字符的识别,目前已经有了很高的识别率;对于小规模的手写体字符识别,也已经走向实用。当前,由于半导体工艺的进步,微处理器的体积越来越小,速度越来越快,这使得构建能够替代PC机功能而体积更小、造价更低的硬件平台成为可能。小规模OCR系统应用广泛,有着巨大的商业前景。如:邮政编码识别、汽车照牌识别、交通标示识别、产品编码识别等。能够处理视频的嵌入式设备也有着广泛的应用前景,如视频监控、视频通讯、机器视觉系统等。1.3本文研究内容1.3.1基本设计思想字符图像的分割与识别系统结构可由图1.2表示【4】。本论文的主要研究内容是印刷体越南字符的识别。越南语和越南文字是用拉丁字母加上声调字符书写的,结构看起来像法国文字,比英语复杂,在字符分割过程有点困难。根据世界上和越南的字符认别成果,本论文采用人工神经网络识别技术。目前用于字符识别的算法主要有基于模板匹配的OCR算法基于人工神经网络的OCR算法。基于模板匹配的OCR的基本过程是:首先对待识别字符进行二值化并将其尺寸大小缩放为字符数据库中模板的大小,然后与所有的模板进行匹配,最后选最佳匹配作为结果。用人工神经网络进行字符识别主要有两种方法:一种方法是先对待识别字符进行特征提取,然后用所获得的特征来训练神经网络分类器。识别效果与字符特征的提取有关,而字符特征提取往往比较耗时。因此,字符特征的提取就成为研究的关键。另一种方法则充分利用神经网络的特点,直接把待处理图像输入网络,由网络自动实现特征提取直至识别。5东南大学硕士学位论文图卜2字符图像的分割与识别系统人工神经网络是一门新兴的交叉学科,它处理信息的方式完全不同于以往的符号逻辑系统,具有一些独特的性质:如信息的分布式存储和并行处理、信息存储与处理的合一、具有自组织、自学习能力,它已经被广泛应用于模式识别、信号处理、知识工程、专家系统、优化组合、智能控制等各个方面【41。同时还有很多的应用还处于研究之中,这些应用都是很吸引人的,说明神经网络具有极大的应用潜力。人工神经网络模式识别为字符识别研究提供了许多种新方法,具有一些传统技术所没有的优点,如速度较快,分类能力强,具有良好的容错能力、并行处理能力和自学习能力。因而采用神经网络识别方式是很好的选择。特征识别是人工神经网络的一个重要功能,如手写字体字符识别,印刷体字符识别等等。本文要讨论的是如何用BP神经网络识别带有噪声的印刷体越南字符。BP网络能学习和存储大量的输入.输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。1.3.2系统的工作原理越南字符识别程序设计能够得以顺利完成,在很大程度上得利于MATLAB这套软件。MATLAB功能强大,它包括数值计算和符号计算,并且计算结果和编程可视化。这为编程6
利用神经网络识别印刷体越南字符 - 图文(2)
2020-04-17 19:03
利用神经网络识别印刷体越南字符 - 图文(2).doc
将本文的Word文档下载到电脑
下载失败或者文档不完整,请联系客服人员解决!