利用神经网络识别印刷体越南字符 - 图文(7)

2020-04-17 19:03

东南大学硕士学位论文３．２．２行切分技术对于行切分，即区分一行行文本文字，人类往往非常容易就能确定，但对于机器而言却并非那么容易，这依赖于成像条件、成像质量等因素。以下以汉字的行切分为例来说明行切分技术。设文本的二值图像为ｆ（ｉ，ｊ），文本图像的大小为ＭｘＭｙ。那么，首先定义ｆ（ｉ，ｊ）在ｉ行上的投影函数为ｇ（ｚ）＝∑厂（∽，ｚ＝１，２，．．．丝＿，＝ｌ（３—６）显然，ｇ（ｉ），ｉ＝ｌ，２，．．．Ｍｘ反映了文本图像的按行灰度累积密度分布情况。详细分析ｇ（ｉ）的分布规律，就可获得文本图像按行书写的排列情况，并确定每行汉字的首行和尾行下标。通常，如果第ｉ行图像处于行间隔，则ｇ（ｉ）几乎为Ｏ，否则ｇ（ｉ）起码大于一个字的平均投影密度。这样，我们就可以在单字平均投影密度值和Ｏ之间选择一个阈值来对ｇ（ｉ）进行二值化，形成二值序列ｇｌ，甑，…ｇＭ）【。其中，ｇｉ要么为Ｏ，要么为ｌ。序列中连续为１的子列为行段，连续为Ｏ的子列为间段，行段或间段中１或Ｏ的个数称为段长。于是，字行的切分就可按如下方法来实现。（１）生成文本图像的二值序列ｇｌ，＆，…ｇ“，并求出全部行段和间段。（２）分别求出最大行段长度和平均长度，如果最大行段长度远大于所处理汉字的大小规模，则对文本图像进行旋转正规化处理，然后转（１），否则转（３）。（３）令ｋ＝１：ｉ＝１：ｌ＝１。（４）分情况对段ｋ进行如下处理：ａ）如果段ｋ为间段，则令ｉ＝ｉ＋段长ｋ；ｂ）如果段ｋ为行段且段长ｋ＞（２／３）行段均长，则令分行ｉ＝＜ｉ，ｉ＋段长ｋ＞及ｉ＝ｉ＋段长ｋ：ｃ）如果段ｋ为行段且段长＜＝（２／３）行段均长，则确定最大行段下标ｋ＞＝ｋ，满足∑段长ｊ＜＝行段最大长度。一『＝七并令分行ｉ＝＜ｉ，ｉ＋段长ｉ＞ｉ＝ｉ＋∑段长ｊ及ｋ＝ｋ．，＝七（３—７）ｄ）ｌ＝ｌ＋１：ｋ＝ｋ＋ｌ。（５）ｋ小于段的总数，则转（４）。第三章字符分割（６）形成分行ｊ＝＜分行首位ｊ，分行末位ｊ＞，ｊ＝１，２…．，１．３．２．３字切分技术仍以汉字为例来说明字切分技术。为了正确切分出汉字，一般对汉字的书写格式作出一定的要求。即如果写在方格稿纸上的，则不允许出格；如果无方格限制的，则字间不得有交错。也就是说，不管有无格式限制，均假定获得的字行图像是脱掉了方格线后形成的结果。可用如下方法来进行字切分。设切分的字行图像为Ｌ（ｉ，ｊ），ｉ＝ｌ，２，…，Ｗ；ｊ＝１，２，…，Ｍｙ，其中Ｗ为该字行的行宽，则令Ｌ的字列投影函数为：局（＿『）＝∑地歹）ｆ＝ｌ（３—８）通过在０和单笔划平均厚度之间取阈值将ｈ（ｊ）进行二值变换，可以形成二值序列ｈＩ，ｈ２，．．．，ｈＭｖ。同样可以称连续为ｌ的字序列为字段，而连续为Ｏ的字序列为间段，并定义连续１或Ｏ的个数为段长。字切分过程如下：（１）根据Ｌ（ｉｊ）求出二值序列ｈｌ，ｈ２…ｈＭｖ，并规定第ｋ个字段左边的间段为第ｋ个间段；（２）求出平均间段长度并求出长度阈值为（１／３）（Ｗ＋最大字段长度＋平均字段长度）；（３）令ｋ：１；间段长度１＝间段均值；ｊ＝字段ｌ起始位置；ｌ＝ｌ。（４）寻找使下式成立的最小ｋ＞＝ｋ；（３—９）窆（（１／２）（间段长度ｉ＋间段长度ｉ＋１）＋字段宽度ｉ）＞长度阈值；ｆ＝七（３—１０）（５）计算△ｊ＝字段长度ｋ＋∑（间段长魔＋字段长岛）：／＝七＋ｌ（６）形成分字ｉ－＜ｊ，ｊ＋△ｐ；（７）ｋ＝ｋ＋ｌ，ｊ＝△ｊ＋ｊ＋间段长度启ｋ＋１；（８）如果ｋ＜字段总数，则ｌ＝ｌ＋ｌ，转（４）；否则（９）得到１个分字ｉ＝（分字首位ｉ，分字末位ｉ），ｉ＝ｌ，２，…，１．东南人学硕士学位论文３．３图文预处理和字符分割理解３．３．１图文预处理彩色图像包含大量颜色信息，会占用较多的存储空间，且处理时也会降低执行速度，因此对图像进行识别等处理时，常将彩色图像转换为灰度图像（如图３?１），以加快处理速度。本文对手写数字图像样本进行了灰度化、二值化、去离散噪声、归一化调整等预处理。在ＭＡＴＬＡＢ中，可以直接调用ｒ加２９ｒａｙ函数能将ＲＧＢ图形或色图矩阵转换成灰度图，二值化处理利用ｇｒａ州ｈｒｅｓｈ函数得到图像的全局闽值，然后使用ｉｍ２ｂｗ将灰度图像转换为二值图像，最后采用ｂｗａｒｅａｏｐｅｎ功能去除聚团灰度值小于３０的部分，如图３－２。图３—１彩色字符图像的灰度化盯Ⅵ，－Ⅲ’９ｋＴ』【一．●。ＬＩ’二Ｉ－．’ＩＩｉ１一Ｈｊｌｉ－１＿Ｉ－Ｌ●【?Ｉ●｝］撕’。ｊｏ习ｌ●ｌＪ乞１吐．１Ｊ＿＾１■?１ｌ卜１■●、：岛ｉＪ：１出■羽：?：ＨＴｉ，ＷＩＩＥ．ｋ厶ｊＩ量！可ｈ－１ｎ。，ｂｌ十－ｊ【１％１Ｈ?’｜ｘＦｌｊ●‘Ｉ■ｄ：—八＿－一ｌ图３—２图像二值化与去除噪声３．３．２字符分割传统的字符分割方法是使用投影法【２１。字符图像二值化后，以像素为单位逐列扫描图像，累加该列值为１的像素，累积的结果即为该列的垂直投影。对图像的所有列扫描完毕后即得到整幅图像的垂直投影。２４第一二章字符分割在垂直投影直方图中由于字符的分界处灰度为１的像素很少，敞投影后陔处表现为很低的波谷，将统计值等了：零的列作为字符分割的界限，如图３．３所示意。一畔州?６厶却岭州畸一ｉｔ爹粕，‘晶沁１｝呲ｉ刊ｋ。ｔ蟮钿ｊ岭．．，．蹦附峙蹦。’。ｋ—－一．———＿．｜寸ｍｊ髓盘产ｊｉ扎ｃ瞳ｒ谢妒拟烨砚．＝ｊ－，一昭６蚀慵ｋ＂‘ｃｋ知｛‘讧｝ｋ沁ｔ蛳娃畦——Ｉ－－－－●ｌｐ仰咖一咖匀扩坠?Ｉ一ｌ协盔即”ｔ”ｐ扣州鲥ｔ．＝！！！！！！苎一甜ｉ掘ｔＡ蟹沁ｊ妒ｄ。产幽５ｐ产８铲翻ｚ节．三！！！ｊｒ蹦姒“钿铲＂ｐｒ警∞ｔ｜甜?．三曼！！！§图３—３投影法但是，由于越南字结构比英文字复杂，应用投影法进行字符分割很困难，通过图３．４可以看出问题。孓域区域图３—４越南字行投影在行投影中对英文字一行文体当然是一个区域，但是对越南字声调字符和辅字符造成两个区域，如果应用投影法分割字符，对越南字的结果应该错的。所以，本章提出了字符分割的方法。原来的ＭＡＴＬＡＢ程序是用了ｒｅｇｉｏｎｐｒｏｐｓ这个函数，功能就是对图中每一个连通的目标进行标记并且识别出来。对于越南文来说，存在音调的原因（比如Ａ，在Ａ的基础上多了一个～，音调及其所属字母没有连通在一起），所以这个函数直接做越南文识别是不可行的。本文在这个函数的功能基础上做了改进，原理就是在用ｒｅｇｉｏｎｐｒｏｐｓ函数先对图中各目标进行识别，然后计算每两个识别后的目标的距离，如果距离很近，就把这两个归类为一个目标。但是这样又出现了新问题，由于有时音调部分会出现两个（比如口），所以导致有可能两个字母之间的距离会比字母与其音调（特别是辅字符上面的音调）的距离小。所以又继续改进，方法是：只计算声调与其它字母的距离，不计算字母之间的距离，然后计算音调与字母的距离，这样问题就可以解决。但是这就需要先判断哪些是音调哪些是字母本身，判断的依据足音调的高度比字母要小。所以设定一个阈值（自适应的，如果图中字母大小不同不会影响判断），小于这个阈值则判断为音调，否则是字母。２５东南人学硕士学位论文ＨＡＮ山ｌＣＨＯＣＭ（ＪＮＧＮＧＡＹ…ＳＩＮＨＮＨ肘．．．Ｕ■■●■■图３—５字符分割结果●－■■■＿●■３．４本章小结本章重点论述了字符分割和理解，是整个字符识别系统的关键。首先是预处理，主要介绍了图像的二值化方法，简单介绍了去除噪声的方法。在分割图像定位得到若干个字符区域后，要先将其分割为单个的字符，然后才能进行下一步单个字符的识别。传统方法是使用投影法，依据垂直投影中的波谷作为分割界限，局限性很大，仅对简单字符、清晰图像适用。本章提出了改进的字符分割方法，在Ｍａｔｌａｂ函数功能的基础上做了改进。但字符分割是正确识别字符的重要步骤，只用单一方法未必能获得最佳效果，充分利用具体应用场合的先验知识可望极大地提高字符分割的准确性。２６

共10页:

利用神经网络识别印刷体越南字符 - 图文(7).doc 将本文的Word文档下载到电脑下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档