东南大学硕士学位论文
利用神经网络识别印刷体越南字符
姓名:阮猛胜申请学位级别:硕士专业:信号与信息处理指导教师:吴乐南
20110830
摘要摘要光学字符识别(OCR)对人类很简单,但对计算机来说并不容易,而手写字符的识别就更加困难了。本文详细阐述了OCR的背景、定义、应用和技术等方面的基本原理和研究进展,在此基础上结合越南文字的具体特点,重点论述了越南字符的模式识别问题,并选择前馈型BP神经网络,具体设计了一个通过扫描图像自动识别188个印刷体越南字符的500×240×188的3层BP网络分类器。通过反向传播法进行有监督的训练后,该系统可以把孤立的越南字符作为一个图像采集系统来识别。实验结果表明本方法能够提取出大部分字符区域,漏检率低,字符分割准确,对于越南文字符识别较准确,值得进一步研究和改进。【关键词】字符识别,神经网络,印刷体字符识别,光学字符识别,BP算法ABSTRACT1kopticaleasytomakeacharacterrecog血ion(OCR)callbeatrivialtaSkforhumaIls,butitisnotsocomputerdistinguishcharactersautoma:tically,especisllyforhand、撕血gs.711listllesisdetailedlyStated廿1e丘mdamentalsandprogressesiIlbackgrounds,defi】1itionS,onappIicatioIlS,aIldtechIliquesofOCR.B舔edspecificSpecialitiesofw硒s仃essed.thesest;眦ements砒ldincoIliunCtionwim廿1eViet啪esewrittiI培s,也epattemrecogIlitionofVie缸lame∞cll乏瞰lctersaA3一IayerclaSsifieruSing500×240×188schemeoffeedforw2耐BP88删血edneuralne咖kswaSdesi印ed讹ch丽nscaIledbecapableofrecogniz吨tlle1VietIlamesech础lcters舶mpropagationimages硼加matically.A舭rmecansuperVisedtrairIiIlgViatllebaCk-iIIlagealg硎ⅡlIll,“ssystemident母isolatedVietIl锄esech觚lcter鹪aIlcanacquisitionsyStem.ctlaracterExp池entalresultsdemons缸.atethat廿1ismem。dex缸actmostofregion,segmentcharactereXactly'aIldrecogIlizeViet彻mesecharacters觚dnllInberSexactly.ItiswomlyofresearshandiIllprovement翕lnber.【Ke",ords】OpticalCharactIerRecogIlition,NeuralNe№r11(s,PriIltedChar∞terR.eco嘶tion,CharacterReco嘶tion,Back.Propagation舢goriⅡ吼n缩略词缩略词WSN.WirelessSensorNetWork.无线传感器网络OCR—OpticalCharacterRecogmtion.光学字符识别FPR-FuzzyPa№mReco印ition一模糊模式识别recognition-印刷体字符识别PCR—Printedch醐犯terHCR—Hand州ttenCharacterIbco鲥tion.手写字符识别ICR-Intelligentch绷aCterRBF.NeurauIARTNeuraulrecognition-智能字符识别ne觚ork,RAdialB捌sFunction.径向基函数神经网络Ne帆ork—Ad印tiveResonaJlcemo巧-自适应共振理论神经网络BP-Backpropagation一反向传播A1、IN.ArtificialneuralDCT.DiscreteCosinenet、vork.人工神经网络Transfo册.离散余弦变换SSE-S啪SquaredE盯0卜总和误差平方III第一章绪论第一章绪论1.1引言作为模式识别,文字识别在信息处理、办公自动化、邮政系统等多方面有着重要的实用价值和理论意义。光学字符识别(OpticalCh嬲lcterRecogIlition,OCR)的概念是德国科学家TauSheck首先提出的,但真正的OCR系统直到电子计算机诞生后才变成现实。现在OCR通常是指利用电子计算机来识别各种形式的文字及字符LIJ。所谓OCR技术,是指利用电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。由于OCR对识别率要求较高,因此如何除错或利用辅助信息提高识别正确率是OCR最重要的课题,ICR(IntelligentCharacterReco鲷ition)的名词也因此而产生。而根据文字资料载体的介质及取得这些资料的方式,就衍生出各种不同的应用。早在1960、1970年代,世界各国就开始有OCR的研究,而研究初期多以文字的识别方法为主,且仅为O至9的数字。以同样拥有方块文字的日本为例,1960年左右开始研究OCR的基本识别理论,初期以数字为对象,直至1965至1970年开始有一些简单的产品,如印刷文字的邮政编码识别系统。识别邮件上的邮政编码,帮助邮局作区域分信的作业;也因此至今邮政编码一直是各国所倡导的地址书写方式。OCR可以说是一种不确定的技术,正确率就像是一个无穷趋近函数,知道其趋近值,却只能靠近而无法达到loo%。因为其牵扯因素太多了,书写者的习惯或文件印刷品质、扫描仪的扫描品质、识别的方法、学习及测试的样本等等,多少都会影响其正确率,也因此,OCR产品除了需有一个强有力的识别核心外,产品操作使用的方便性、所提供的除错功能及方法,都是决定产品好坏的重要因素【2】。OCR识别系统的目的很简单,只是要对图像作一个转换,使图像内的图形继续保存,而把表格内资料及图像内的文字,一律变成计算机文字,使得影像资料的储存量减少、识别出的文字可再使用及分析,当然也可节省因键盘输入的人力与时间。字符识别是近年发展起来的一门自动化技术,因为有广泛的实际应用价值,所以在很多领域有所应用:如医学、天气预报、自动化、控制、文语转换等。