东南大学硕士学位论文3.2.2行切分技术对于行切分,即区分一行行文本文字,人类往往非常容易就能确定,但对于机器而言却并非那么容易,这依赖于成像条件、成像质量等因素。以下以汉字的行切分为例来说明行切分技术。设文本的二值图像为f(i,j),文本图像的大小为MxMy。那么,首先定义f(i,j)在i行上的投影函数为g(z)=∑厂(∽,z=1,2,...丝_,=l(3—6)显然,g(i),i=l,2,...Mx反映了文本图像的按行灰度累积密度分布情况。详细分析g(i)的分布规律,就可获得文本图像按行书写的排列情况,并确定每行汉字的首行和尾行下标。通常,如果第i行图像处于行间隔,则g(i)几乎为O,否则g(i)起码大于一个字的平均投影密度。这样,我们就可以在单字平均投影密度值和O之间选择一个阈值来对g(i)进行二值化,形成二值序列gl,甑,…gM)【。其中,gi要么为O,要么为l。序列中连续为1的子列为行段,连续为O的子列为间段,行段或间段中1或O的个数称为段长。于是,字行的切分就可按如下方法来实现。(1)生成文本图像的二值序列gl,&,…g“,并求出全部行段和间段。(2)分别求出最大行段长度和平均长度,如果最大行段长度远大于所处理汉字的大小规模,则对文本图像进行旋转正规化处理,然后转(1),否则转(3)。(3)令k=1:i=1:l=1。(4)分情况对段k进行如下处理:a)如果段k为间段,则令i=i+段长k;b)如果段k为行段且段长k>(2/3)行段均长,则令分行i=<i,i+段长k>及i=i+段长k:c)如果段k为行段且段长<=(2/3)行段均长,则确定最大行段下标k>=k,满足∑段长j<=行段最大长度。一『=七并令分行i=<i,i+段长i>i=i+∑段长j及k=k.,=七(3—7)d)l=l+1:k=k+l。(5)k小于段的总数,则转(4)。第三章字符分割(6)形成分行j=<分行首位j,分行末位j>,j=1,2….,1.3.2.3字切分技术仍以汉字为例来说明字切分技术。为了正确切分出汉字,一般对汉字的书写格式作出一定的要求。即如果写在方格稿纸上的,则不允许出格;如果无方格限制的,则字间不得有交错。也就是说,不管有无格式限制,均假定获得的字行图像是脱掉了方格线后形成的结果。可用如下方法来进行字切分。设切分的字行图像为L(i,j),i=l,2,…,W;j=1,2,…,My,其中W为该字行的行宽,则令L的字列投影函数为:局(_『)=∑地歹)f=l(3—8)通过在0和单笔划平均厚度之间取阈值将h(j)进行二值变换,可以形成二值序列hI,h2,...,hMv。同样可以称连续为l的字序列为字段,而连续为O的字序列为间段,并定义连续1或O的个数为段长。字切分过程如下:(1)根据L(ij)求出二值序列hl,h2…hMv,并规定第k个字段左边的间段为第k个间段;(2)求出平均间段长度并求出长度阈值为(1/3)(W+最大字段长度+平均字段长度);(3)令k:1;间段长度1=间段均值;j=字段l起始位置;l=l。(4)寻找使下式成立的最小k>=k;(3—9)窆((1/2)(间段长度i+间段长度i+1)+字段宽度i)>长度阈值;f=七(3—10)(5)计算△j=字段长度k+∑(间段长魔+字段长岛):/=七+l(6)形成分字i-<j,j+△p;(7)k=k+l,j=△j+j+间段长度启k+1;(8)如果k<字段总数,则l=l+l,转(4);否则(9)得到1个分字i=(分字首位i,分字末位i),i=l,2,…,1.东南人学硕士学位论文3.3图文预处理和字符分割理解3.3.1图文预处理彩色图像包含大量颜色信息,会占用较多的存储空间,且处理时也会降低执行速度,因此对图像进行识别等处理时,常将彩色图像转换为灰度图像(如图3?1),以加快处理速度。本文对手写数字图像样本进行了灰度化、二值化、去离散噪声、归一化调整等预处理。在MATLAB中,可以直接调用r加29ray函数能将RGB图形或色图矩阵转换成灰度图,二值化处理利用gra州hresh函数得到图像的全局闽值,然后使用im2bw将灰度图像转换为二值图像,最后采用bwareaopen功能去除聚团灰度值小于30的部分,如图3-2。图3—1彩色字符图像的灰度化盯Ⅵ,-Ⅲ’9kT』【一.●。LI’二I-.’IIi1一Hjli-1_I-L●【?I●}]撕’。jo习l●lJ乞1吐.1J_^1■?1l卜1■●、:岛iJ:1出■羽:?:HTi,WIIE.k厶jI量!可h-1n。,bl十-j【1%1H?’|xFlj●‘I■d:—八_-一l图3—2图像二值化与去除噪声3.3.2字符分割传统的字符分割方法是使用投影法【21。字符图像二值化后,以像素为单位逐列扫描图像,累加该列值为1的像素,累积的结果即为该列的垂直投影。对图像的所有列扫描完毕后即得到整幅图像的垂直投影。24第一二章字符分割在垂直投影直方图中由于字符的分界处灰度为1的像素很少,敞投影后陔处表现为很低的波谷,将统计值等了:零的列作为字符分割的界限,如图3.3所示意。一畔州?6厶却岭州畸一it爹粕,‘晶沁1}呲i刊k。t蟮钿j岭..,.蹦附峙蹦。’。k—-一.———_.|寸mj髓盘产ji扎c瞳r谢妒拟烨砚.=j-,一昭6蚀慵k"‘ck知{‘讧}k沁t蛳娃畦——I----●lp仰咖一咖匀扩坠?I一l协盔即”t”p扣州鲥t.=!!!!!!苎一甜i掘tA蟹沁j妒d。产幽5p产8铲翻z节.三!!!jr蹦姒“钿铲"pr警∞t|甜?.三曼!!!§图3—3投影法但是,由于越南字结构比英文字复杂,应用投影法进行字符分割很困难,通过图3.4可以看出问题。孓域区域图3—4越南字行投影在行投影中对英文字一行文体当然是一个区域,但是对越南字声调字符和辅字符造成两个区域,如果应用投影法分割字符,对越南字的结果应该错的。所以,本章提出了字符分割的方法。原来的MATLAB程序是用了regionprops这个函数,功能就是对图中每一个连通的目标进行标记并且识别出来。对于越南文来说,存在音调的原因(比如A,在A的基础上多了一个~,音调及其所属字母没有连通在一起),所以这个函数直接做越南文识别是不可行的。本文在这个函数的功能基础上做了改进,原理就是在用regionprops函数先对图中各目标进行识别,然后计算每两个识别后的目标的距离,如果距离很近,就把这两个归类为一个目标。但是这样又出现了新问题,由于有时音调部分会出现两个(比如口),所以导致有可能两个字母之间的距离会比字母与其音调(特别是辅字符上面的音调)的距离小。所以又继续改进,方法是:只计算声调与其它字母的距离,不计算字母之间的距离,然后计算音调与字母的距离,这样问题就可以解决。但是这就需要先判断哪些是音调哪些是字母本身,判断的依据足音调的高度比字母要小。所以设定一个阈值(自适应的,如果图中字母大小不同不会影响判断),小于这个阈值则判断为音调,否则是字母。25东南人学硕士学位论文HAN山lCHOCM(JNGNGAY…SINHNH肘...U■■●■■图3—5字符分割结果●-■■■_●■3.4本章小结本章重点论述了字符分割和理解,是整个字符识别系统的关键。首先是预处理,主要介绍了图像的二值化方法,简单介绍了去除噪声的方法。在分割图像定位得到若干个字符区域后,要先将其分割为单个的字符,然后才能进行下一步单个字符的识别。传统方法是使用投影法,依据垂直投影中的波谷作为分割界限,局限性很大,仅对简单字符、清晰图像适用。本章提出了改进的字符分割方法,在Matlab函数功能的基础上做了改进。但字符分割是正确识别字符的重要步骤,只用单一方法未必能获得最佳效果,充分利用具体应用场合的先验知识可望极大地提高字符分割的准确性。26
利用神经网络识别印刷体越南字符 - 图文(7)
2020-04-17 19:03
利用神经网络识别印刷体越南字符 - 图文(7).doc
将本文的Word文档下载到电脑
下载失败或者文档不完整,请联系客服人员解决!