数字图像处理大作业
—— 晶振表面字符识别
小组成员: 专业班级:
摘 要
随着现代信息产业的发展,字符识别系统的需要越来越高。字符识别是字符图像识别系统中的关键环节。采用图像处理和神经网络相结合的方法设计新的字符识别算法,先对截取的字符图像进行一系列图像预处理,然后再进行边缘检测和特征提取,最后输入BP神经网络进行训练、识别,其中BP神经网络模型属于改进型神经网络。通过一系列神经网络训练和仿真实验,识别速度和正确率得到了明显的提高。 关键词:图像预处理 BP神经网络
一. 绪论......................................................................................................................................... 3
1.1 文字识别系统简介 ........................................................................................................... 3 1.2 背景及研究方向 ............................................................................................................. 3 1.3 选题意义及可行性分析 ................................................................................................. 3 二. 系统设计方案 ......................................................................................................................... 4
2.1 系统流程图 ..................................................................................................................... 4 三. 图像的预处理 ......................................................................................................................... 5
3.1 图像二值化处理 ............................................................................................................. 5
3.1.1 阈值选取算法分析 ............................................................................................... 5 3.1.2 算法分析及实现 ................................................................................................... 6 3.2 图像的锐化 ..................................................................................................................... 6 3.3 去除离散噪声 ................................................................................................................. 7 3.4 字符分割 ......................................................................................................................... 8 3.5 图像归一化处理 ........................................................................................................... 10 3.6 字符紧缩 ....................................................................................................................... 11 3.7 图像细化处理 ............................................................................................................... 12 四. 字符特征提取 ....................................................................................................................... 14
4.1 特征提取方案分析 ....................................................................................................... 14 4.2 十三特征提取方案分析及实现 ................................................................................... 14 五. BP神经网络进行字符识别 .................................................................................................. 16
5.1 人工智能简介 ............................................................................................................... 16 5.2 BP神经网络简介 .......................................................................................................... 16 5.3 BP神经网络算法及方案设计 ...................................................................................... 16 5.4 BP神经网络算法程序实现 .......................................................................................... 17 六. 总结与体会 ........................................................................................................................... 21
参考文献........................................................
一. 绪论
1.1 文字识别系统简介
文字识别,就是基于 OCR(光学字符识别)技术,将扫描仪、摄像机等光学输入方式得到的书籍、报刊、文稿、表格等印刷品的文字图像信息转化为可供计算机识别和处理的文本信息。由于可以大大提高工作效率,文字识别技术已经越来越受到人们的关注。特别是在我国,由于信息化建设的全面展开,为文字识别技术提供了广阔的应用舞台,诸如数字图像处理应用于档案保护管理中,图像技术以及图像信息检索技术应用于数字档案馆建设,文字图像信息识别技术应用于档案输入管理中,文字识别技术在银行票据识别系统中的应用,同时,文字识别技术还应用于办公自动化、税务、电子出版、公安、交通运输、邮政分拣等行业。 1.2 背景及研究方向 目前,许多信息都是记录在纸上的文字图像,将这些信息输入计算机是非常繁琐而低效率的工作,这在一定的程度上阻碍了社会信息化的进程。因而,作为信息化基础的数据输入成了计算机应用中的瓶颈问题。人们接受信息最频繁的是视觉通道。在日常学习和生活中,所处理的信息有75%—85%是视觉信息,其中文字信息愈来愈占重要地位。比如对各种期刊文献的阅读、查找、翻译;对各种统计报表的汇总、计算、分析;对各种函件票证的分拣、传送、验核等。要实现对这些文字信息处理过程的机械化、自动化,其先决条件就是利用计算机对这些文字信息进行识别。
字符识别处理的信息可分为两大类:一类是文字信息,处理的主要是用各国家,各民族的文字(如:汉字,英文等)书写或者印刷的文本信息,目前在印刷体和联机手写方面技术已经趋向成熟,并推出了很多应用系统;另一类是数据信息,主要是阿拉伯数字以及少量特殊符号组成的各种编号和统计数据。如:邮政编码,统计报表,财务报表,银行票据等等,处理这类信息的核心技术是手写数字识别。这几年来我国开始大力推广的“三金”工程在很大程度上要依赖数据信息的输入,如果能通过手写数字识别技术实现信息的自动录入,无疑会促进这一事业的进展。因此,手写数字的识别研究有者重大的显示意义,一旦研究成功并投入应用,将产生巨大的社会和经济效益。手写数字识别(Handwritten Numeral Recognition)是光学字符识别技术(Character Recognition,简称OCR)的一个分支,研究的对象是:如何利用电子计算机自动辨认人手写在纸张上的阿拉伯数字。多年的研究实践表明,对于完全没有限制的手写数字,几乎可以肯定:没有一种简单的方案能达到很高的识别率和识别精度。因此,最近这方面的努力向着更为成熟。复杂,综合的方向发展,一方面,研究工作者努力把新的知识运用到预处理,特征提出,分类当中,如:神经网络,数学形态等。在手写数字识别研究中,神经网络技术和多中方法的综合研究是重要的,全新的方向。 1.3 选题意义及可行性分析
随着国家信息化进程的加速,手写数字识别的应用将越来越广泛,因此当加强在这当面的研究与开发,个人认为,应用系统的性能的关键与瓶颈仍然在与手写数字识别核心算法性能上,最终目标是研究零误识率和低拒识率得到高速识别算法,而神经网络技术与图像处理技术的结合运用,将会解决这一难题。
数字的识别只有十种,笔画又简单,其中识别问题似乎不是很苦难。但事实上,一些测试结果表明,数字的正确识别率不如印刷体汉字识别正确率,甚至也不如联机手写汉字职别率高,而只仅仅优于脱机手写汉字识别。这其中主要原因是:字形相差不大,使得准确区分某些数字相当困难;第二,数字虽然只有十种,而且笔画简单,但同一数字写法千差万别,全世界各个国家各个地区的人使用,其中书写上带有明显的区域特性,很难完全做到兼顾世界各种写法的极高识别率的通用性数字识别系统。另外,在实际应用中,对数字识别单字识别正确率的要求要比文字要苛刻得多。这是因为,数字没有上下文关系,每个单字的识别都事关重要,而且数字识别经常涉及的财会,金融领域其严格性更是不言而喻的。因此,用户
的要求不是单纯的高正确率,更重要的是极低的,千分之一甚至万分之一以下的误识率。此外,大批量数据处理对系统速度又有相当的要求,许多理论上很完美但速度过低的方法是行不通的。因此,研究高性能的手写数字识别酸法是一个相当的挑战性的任务。利用图像处理技术和神经网络识别技术,将大大提高对文字图像识别的能力,也可以解决文字识别率,识别清晰度等问题。整个系统的程序实现分为图像预处理和神经网络识别两大模块。在图像预处理的过程当中,采用了许多图像处理的技术,最后把每个数字的特征提取出来。这些技术包括图图像据读取,图象的灰度化,二值化,图像的调整,离散噪声点的去除,字符的切割,图象的缩放,字符的细化,字符的平滑和图像的求梯度等图像处理技术,最后是数字字符特征的提取。其结果再利用训练后的神经网络进行字符识别。利用神经网络进行字符识别的过程主要包括网络的训练、数据的读取、字符的判定和结果的输出。
二. 系统设计方案
2.1 系统流程图
图像预处理 BP神经网络字符识别
图2-1-1 系统总流程图
图2-1-2 图像预处理流程图
训练和识别
BP神经网络 字符特征读取
输出结果
图2-1-3 BP神经网络识别流程
三. 图像的预处理
3.1 图像二值化处理
一副图像包括目标物体,背景,还有噪声(见图3.1.1)。进行图像预处理之前,我们往往需要对导入的灰度图像进行二值化处理。图像的二值化就是将图像中的像素点的灰度值设为0或255(黑和白),使图像呈现明显的黑白效果。
图3.1.1 3.1.1 阈值选取算法分析
图像的二值化算法。它可以采用自适应阀值法,也可以采用给定阀值法。系统中采用的是给定自适应阀值的方法。其算法的实现是通过大律法。经过大律法得到适合的阀值。不过我们先对图像绘出直方图(见图3.1.2),再综合算法调试得到的阈值结果进行比较,经过不断
尝试,最终确定阈值的大小。
图3.1.2