利用神经网络识别印刷体越南字符 - 图文(6)

2020-04-17 19:03

尔南人学硕fj学何论文(1)12个大单元音:≯(带第‘声调字符),其中6个与英文字?样的字足A,E,O,I,U,Y:6个‘J英文字有差别的字足A,A,仑,0,6,U.。图2—5特别字符有辅字符12个大单元音字和6个声调字符一起构成72个大字。另外还有17个大辅音字,如图2—5所示(其中D字是特别的,如图2.6)。总共有89个大字:.A,A,A,A,A,A;A,A,A,A,A,叁;A,A,A,A,A,冬一E,色,亡,e,豆,P;色,色,色,宦,E,e.0,0,0,0,O,Q;0,O,O,O,O,Q;O,6,O,0,0,◇.I,i,i,i,i,I.u,O,D,O,O,U;L,,nc厂,(厂,仃,U图2—6特别人字和小字一D字-Y,Y,Y,Y,Y,Y,-B,C,D,D,G,H,K,L,M,N,P,Q,R,S,T,V,X。(2)同样地也有89个小字:,、,~苎参量墨公^v二二二=va.a.a.a.a.孕;,、,a,a,a,a,a,孕;^a,a,a,a,a,毒-工盖工=.e,e,e,e,e,9;,、,e,e,e,e,e,9一.~.!.!.,~^工爻工=^o,o,o,o,o,Q;1,l,l,l,l,lu,u,u,u,u,U;a,a,o,o,a,9;o,o,o,o,o,Ou,u,u,U,Lr,Ul7第二章识别方法与越南字符y,夕,夕,夕,夕,yb,c,d,d,g,h,k,l,m,n,p,q,r,s,t,V,x。(3)10个数字:0,1,2,3,4,5,6,7,8,9。总共有188个字符,所以其识别过程比英文字符复杂。2.6本章小结作为背景知识和字符识别技术综述,本章首先介绍了模式识别的方法,因为字符识别系统是模式识别学科的重要研究领域,模式识别理论对于字符识别理论很重要。其次介绍了OCR系统的常用方法和思路,即传统的统计决策方法,结构识别方法,和人工神经网络方法的原理和特点,其中人工神经网络识别方法是人们最初用来进行印刷字符识别研究的方法。然后描述了传统人工神经网络方法的流程。最后介绍了越南字符结构,并和英文字符进行了比较。18第三章字符分割第三章字符分割3.1预处理在字符图像的获取过程中难免产生误差,这些误差降低了字符图像的质量,从而影响了字符识别的正确率;另外对于彩色或灰度图像进行识别往往运算量也过大,因此识别前需要进行字符图像的预处理。3.1.1图像的二值化二值化是图像分割中的一个重要方法。它是为了将图像中有意义的特征或者需要应用到的特征提取出来。这些特征可以是图像场的原始特征,如物体占有区的象素灰度值,物体轮廓线和纹理特征等【l】。二值化的方法是利用图像中要提取的目标物与背景有灰度特性上的差异。如设置一个灰度阈值,凡是灰度值低于这个阈值的像素值置O,而灰度值高于这个阈值的像素值置1。这样,就可以将图像中的背景和目标明显地区分开来。设原始图像A=(ai,j)MxN中(ij)点处像素的值是ai.i,设r为阈值,则有:%圹忙:::::二芸三一∥Du(3—1)k一般取l,但也可以取其他值。阈值也可以设为一个灰度范围[ValveDown,ValveTop】。图像中象素灰度值在灰度范围内的变为l,其它的均变为O,即‰圹k二二兰=二=i引:3.1.2去除噪声同的方法,否则难以获得满意的效果。常见的噪声有:19∽2,图像中的噪声种类很多,对图像信息的影响十分复杂。有些噪声和图像信息互相独立,有些是相关的,噪声之间也有些相关。因此要减少图像噪声,必须针对具体情况采用不东南人学硕士学位论文1、加性噪声:与图像信号强度不相关,如图像在传输过程中引进的信道噪声、电视摄像机扫描图像的噪声等。这类含噪图像g可看成理想无噪图像f和噪声n之和,即g=f+n(3—3)2、乘性噪声:与图像信号是相关的,往往随图像信号的变化而变化,这类噪声与图像的关系是:g=f+fn(3—4)3、量化噪声:是数字图像的主要噪声源,显示出数字图像和原始图像的差异,减少这种噪声的最好办法就是按灰度级概率密度函数选择最优量化级。4、“椒盐”噪声:经常出现在图像中,当摄像机中包含一些失效像素时,所采集的图像就会出现这类噪声,因其在图像中表现为黑自相间的斑点而得名。图像降噪的方法有小波滤波、平均值滤波、形态学滤波及中值滤波等。小波滤波是一种实现简单而效果较好的方法,是对小波分解后的各层系数模大于和小于某阈值的系数分别进行处理,然后利用处理后的小波系数重构出消噪后的图像;平均值滤波是因为在求平均值的过程中图像的静止部分不会改变,而对每一幅图像,各不同的噪声图案则累积得很慢,通过求平均值可以有效地降低随机噪声的影响;形态学滤波是从数学形态学中发展出来的一种新型的非线性滤波方法,是基于信号(图像)的几何结构特性,利用预先定义的结构元素对信号进行匹配或局部修正,以达到提取信号、抑制噪声的目的;中值滤波是基于排序统计理论的一种能有效抑制噪声的非线性信号处理技术,这种滤波器的优点是运算简单且速度快,在滤除叠加白噪声和长尾叠加噪声方面表现了极好的性能,并且中值滤波器能很好地保护图像边缘,使图像较好地复原。去除噪声的方法有很多,比如固定阈值去噪法、动态阈值去噪法、邻域平均法以及中值滤波法等等。由于一般文档都是白纸黑字且噪声问题并不很严重,所以去除噪声就变得相对简单了。主要通过阈值控制和文本范围控制就可以解决,即把像素值在一定范围之外的像素或者像素位置在文本区域以外的像素视为噪声点并去除。3.2字符分割在一般的字符识别中,字符识别之前要经过二值化过程和行字切分过程,以分割出一个个具体的二值表示的字符图像点阵,作为单字符识别的输入数据。其中,识别字符过程中的第一步就是要把获得的数字灰度图像转变为数字二值图像,这个过程称为二值化,采用的技术通常称为阈值化技术。第三章字符分割由于获得的文本图像不但包含了组成文本的一个个字符,而且包含了字符行间与字间的空白,甚至还会带有各种标点符号,这就需要采用一定的处理技术,将文本中的字符切分出来,形成单个字符的图像阵列,以进行单字识别处理。这就是字符文本的行字切分问题,分为行切分和列切分两个主要步骤,首先由行切分得到一行行文本字行,然后在文本字行中进行列切分得到一个个单独的字符点阵。3.2.1阈值化技术为了能够正确切分出一个个字符,简单地把字符看作是由黑色的字形和白色的背景(或白色的字形和黑色的背景)组成,不但不会影响对字符的识别,而且还可大大提高处理效率。进行图像二值变换的关键是要确定合适的阈值,使得字符与背景能够分割开来,而且二值变换的结果图像必须要具备良好的保形性,不丢掉有用的形状信息,不会产生额外的空缺等等。较常见的阈值确定方法包括有设定法、直方图法、经验函数法、局部法等等。l、设定法:主要是依据对于字符文本图像灰度取值的了解,通过人工预先给出一个固定的阈值来进行文本图像的二值变换。由于该方法不能考虑到所处理图像具体的灰度分布情况,所以对不同条件下形成的图像往往会产生不一致的结果,抗干扰性较差。2、直方图法:通过对数字图像进行灰度直方图统计,然后根据灰度分布具体情况动态选择阈值来进行图像的二值变换。选择的方法,一般是取灰度级直方图中两峰值之间的谷值作为二值变换的阈值。3、经验函数法:首先对每行文本像素统计其最大灰度值,然后再求出最小的每行最大灰度取值(设为Gm)及平均背景灰度值Ba,最后再通过(1/2)x(Gm+Ba)来确定阈值。经验函数法也可以通过二次间接方法来完成,即在上面Gm的基础上,先令Tl=Gm+△T(经验确定),来进行字符与背景的分割,然后分别求出字符与背景的平均值Fa和Ba,最后得出最终采用的阂值为(1/2)x(Fa+Ba)(3—5)4、局部阈值确定方法:对于干扰较大的字符文本,有时采用统一的整体阈值很难得到令人满意的结果,此时需要设计依赖于像素及其局部区域灰度变化的阈值来进行图像的二值化,称为局部阈值确定方法。一种较直观的局部方法是同时考虑像素的灰度和局部梯度均值。即首先根据直方图来获得整体阈值T,然后在对具体像素进行二值化时再考虑其与周围像素的平均差分值,作为T的修正量△T,最后用T+△T来进行二值化。2l


利用神经网络识别印刷体越南字符 - 图文(6).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:浅谈中国历史文化名城的保护与发展

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: