题目:联机手写体字符识别 摘要
手写体字符识别就是通过计算机用数学技术方法来研究模式的自动处理和识别。随着计算机技术的发展,人类对模式识别技术提出了更高的要求。特别是对于大量己有的印刷资料和手稿,计算机自动识别输入己成为必须研究的课题,所以数字识别在文献检索、办公自动化、邮政系统、银行票据处理等方面有着广阔的应用前景。识别的方法有多种,其中包括模板匹配方法、统计决策法、句法结构、模糊判别法、模糊推理方法以及神经网络方法等,本文分析了各种方法的特点。
关键词:字符识别;识别方法;模板匹配
Abstract
Handwritten character recognition technique is to use mathematical methods to study and identify the mode of automatic processing by a computer. With the development of computer technology, the human pattern recognition technology put forward higher requirements. Especially for a large number of already some printed materials and manuscripts, the computer automatically recognizes the input has become necessary to study the subject, so in terms of digital identification document retrieval, office automation, the postal system, the bank-note processing and other fields have broad application prospects. There are a variety of identification methods, including template matching method, statistical decision method, syntactic structure, fuzzy judgment method, fuzzy reasoning and neural network methods, this paper analyzes the characteristics of various methods. Keywords:Template matching; character recognition; Recognition
引言
随着信息网络的推广,有大量的数据要输入计算机网络。而且在现代信息社会,方方面面都要与数字打交道。目前手写数字识别主要的应用有以下三个领域:在邮件分拣中的应用,在财税、金融领域中的应用以及在大规模数据统计中的应用。手写体数字识别今后将在更多的领域应用。所以手写数字识别的研究具有很重要的实际意义。另外,因为手写数字的模式比较简单,总的类别只有10类,因此可以做为各种算法的实验平台。而且由于阿拉伯数字的国际通用性,各国研究人员可以很好的相互交流。所以手写数字识别的研究具有很好的理论意义。
正文
1.手写体字符识别过程:
手写体字符识别一般由预处理、特征提取、分类器及后处理等组成。
1.1 预处理
依具体识别方案的不同,应含定位、二值化、去噪、切分、大小规格化等步骤。即先定位要识别的手写体,依需要将灰度图像采用全局阈值化、自适应阈值化等方法二值化并去噪。字符大小分为:线性和非线性归一化,线性归一化是对字符图像作比例变换,易数学处理,但能保证输入向量维数统一,不能对字符变形和保持字符的基本形状结构。非线性归一化能克服线性归一化的缺点,但运算复杂,耗时长,对于时性要求强的情况不适用。 1.2 特征提取
特征的提取是手写体字符识别的最为重要的过程,其中有许多方法,也是论文详细研究对象,下文将有详细的方法介绍。 1.3 分类器
使用不同分类器则有不同数字识别方法,可选的分类器有:神经网络、支持向量机。通常先通过聚类确定各类的代表点(取均值中心点),再计算各待测样本域各代表点距离,将其归入与最近点所属的类。其距离可取马氏、欧式、明氏等。是简单而直观的分类器设计方法,但其缺点是所选“代表点”不一定能很好地代表各类,将使错误率增加。
2.目前研究手写体数字识别的方法有:
(1)模板匹配法
模板匹配法是模式识别中常用的基本方法之一。其基本原理是:对每个模式类都定义一个标准的模式并将它作模板,这种方法适用于印刷体字符或受到相当限制的手写体字符,对于脱机手写数字这种方法很难适用。 (2)统计决策法
统计决策法是模式识别的一个经典方法,它是在概率论和数理统计的基础上产生和发展,因其严格的数学基础,此方法发展得较为成熟。而且它也是模式识别中能用严格的数学计算来识别字符的方法之一。该方法抗干扰能力较强,但是较难抽取到好的特征且难以反映模式的精细结构特征。 (3)句法结构法
句法结构法是在形式语言和自动机的基础上产生的,它能够反映模式的结构特征,而且对模式的结构特征变换不敏感,因此多用于联机识别,但由于抽取字符的基元比较困难,因而不是特别适用于脱机识别,同时这一方法的理论基础不可靠,抗干扰能力较弱。 (4)模糊判别法
模糊判别法的理论基础是模糊数学,用隶属度将模糊集合模式类划分为若干子集,子集总数与模式的类别总数相同然后根据择近原则分类,由于隶属度函数度量了未知样本同标准模式之间的相似程度,所以此方法能够反映出字符模式的
整体特征,并且允许待识样本有一定的变形和干扰,只是要建立合理的隶属度函数不太容易。 (5)逻辑推理法
逻辑推理法以人工智能为基础。其基本原理是:运用知识库中的规则从事实出发进行推理得到相应的结果,而每个结果都是相应的模式类。所谓知识就是待识字符的构成规律。此法的缺点是难以得到待识字符的事实。 (6)神经网络法
神经网络法利用神经网络的学习和记忆功能,让神经网络学习各个模式类别中的大批训练样本,以记住各模式类别中的样本特征,然后在识别待识别样本时将他们逐个与记忆中的各模式类别的样本特征相比较,从而确定样本所属的类别。
结论
以上各种方法各有其特点,如模板匹配法,虽然方法适用于印刷体字符或受到相当限制的手写体字符,对于脱机手写数字这种方法很难适用。但是模板匹配法是模式识别中常用的基本方法之一。用法较完善,前人研究也比较深入,有大量的资料可以查阅,可以很好的学习以及使用这种方法。毕业设计将采用这种方法对联机手写体字符识别的领域进行学习和探索。
附录
参考文献
【1】王军,王员云.《基丁模板匹配的联机手写数字识别》。现代计算机,2008,45(3):48-50 【2】荆涛,王仲,《光学字符识别技术与展望》。计算机工程,2003,29(2):1-3
【3】刘东泽,蔡建立.《基丁神经网络的手写数字识别》。福建电脑.2009,38(11):264-269 【4】张良均,曹晶,蒋世忠.《神经网络实用教程》。北京:机械工业出版社.2008.2 【5】朱大奇,史慧.《人工神经网络原理及应用》。北京:科学出版社.2006.3
【6】孔月萍,周继,于军琪等.《人工智能及其应用》。北京:机械上业出版社.2007.10 【7】张青贵.《人工神经网络导论》。北京:中国水利水电出版社.2004
【8】周金海.《人-T智能学习辅导与实验指导》。北京:清华人学出版社.2008。3 【9】张德丰.《MATLAB神经网络应用设计》。北京:机械工业出版社.2009.1
【10】钟乐海,胡伟.《手写体数字识别系统中一种新的特征提取方法》。四川大学学报.2007.44(5) 【11】耿两伟,张猛,沈建京.《基于结构特征分类BP网络的手写数字识别》。计算机技术与发展.2007.17(1) 【12】董慧.《手写体数字识别中的特征提取和特征选择研究》。北京:北京邮电大学,2007 【13】钟洛,潘吴,封笃等.《模式识别》。武汉:武汉大学出版社2006.10 【14】边肇祺,张学工.《模式识别导论》。北京:清华大学出版社.2000.10
【15】李葆青.《基于卷积神经网络的模式分类器》。大连理工大学学报.2003,24(2):19-23 【16】苏j盘祁,尉宇,王涛。《改进Hough变换的算法实现》。现代电子技术.2009,(10):42—44 【17】冈萨雷斯等著,阮秋琦等译。《数字图像处理(第二版)》。北京:电子工业出版社,2007 【18】黄文杰.《基于投影的车牌字符分割方法》。现代计算机,2009(313):57-60