基于数字图像的车牌识别系统设计(4)

2019-02-15 15:17

陕 西 理 工 学 院 毕 业 设 计

(5)取一个较大的边缘阀值,在亮度图像中求取边缘; (6)在每个符合色彩过滤条件的区域中进行边缘点统计,根据其在水平方向和垂直方向的投影,确定该连通区域中可能存在车牌的区域;

(7)对于上一步得到的多个可能是车牌的区域进行面积、形状等特征的分析及纹理特征分析,检验是否能够找到有效的车牌区域。若是,定位成功,结束流程;否则,设置黑色V分量的取值范围,重复第(3)至第(7)步,如能找到黑色车牌则定位成功,否则定位失败或图像中不存在车牌图像。 3.3.3 车牌定位中的关键问题

二值图像经过边缘提取和滤波后,大量的背景和噪声被去除掉,车牌区域由于其物理特征,字符部分被基本保存下来。车灯、车前的横栏部分以及一些特殊车体标志在形状和灰度变化上与车牌区域相似,因此,有时这些区域在图像预处理阶段并没有被消除,而是和车牌区域一起被保留下来,在定位过程中,我们称其为伪车牌区域,如何有效识别车牌区域与伪车牌区域是车牌定位过程中的关键。车牌定位算法一般均分为车牌粗定位和车牌细定位两个阶段。

1.车牌粗定位

车牌粗定位就是确定车牌的大致位置。本文给出的基于色彩过滤的定位算法,可能会得到几个候选车牌区域。利用车牌呈矩形并且高宽比一定的特点,可将伪车牌区域一一排除。在实际处理中取车牌的宽高比为3,逐一比较几个候选区域,对宽高比最接近3的候选区域确定为实际车牌区域,这样在大多数情况下能准确地找到车牌的实际位置,实现车牌的大致定位。

2.车牌细定位

粗定位得到的车牌区域还需进一步检测上、下、左、右边界的坐标,以实现车牌的准确定位。 ·车牌上下边界检测的具体过程

(1)定义跳变点若某一像素点与下一像素点的颜色相反,则记录其为跳变点。

(2)找到最佳检测阀值本文在实验中采集和处理的图像大小为宽800像素左右,高为600像素左右,车牌区域约为150X50像素。因此,经过实验不断测定,设检测阀值k为16,实验结果较为理想。

(3)确定Lb和血从下向上逐行扫描图像,若某一行跳变点个数大于阀值,则设其为待测车牌最低点所在行Lb,继续逐行扫描,直至变化次数小于8,将该行设为车牌最高点所在行三f。

(4)完成上下边界定位若三6和三f之差大于15,则认为检测到的行是车牌的实际上下边界。否则,继续逐行扫描,如果未检测到上述条件的结果,重复上述操作,直至检测到目标。 ·车牌左右边界检测的具体过程

(1)找到已经定位车牌大致位置的左边起始位置,逐列作垂直投影。

(2)若连续Ⅳ列投影值均小于某一特定阀值k(该值由经验值获得,本文经实验测定取10),而至某一列投影值有一突变并且大于阀值k,则设该列为车牌左边界三,。

(3)车牌左边界加上车牌宽度,其中,车牌宽度大约为150像素,为降低误差此处取130,从该列开始,逐列计算垂直投影值。

(4)若连续Ⅳ列投影值均大于某一特定阀值k,而至某一列投影值有一突变并且 小于阀值k,则设该列为车牌右边界Lr。

3.车牌进一步处理

经过上述方法分割出来的车牌图像中存在目标物体、背景还有噪声,要想从图像中直接提取出目标物体,最常用的方法就是设定一个阈值T,用T将图像的数据分成两部分:大于T的像素群和小于T的像素群,即对图像二值化。均值滤波是典型的线性滤波算法,它是指在图像上对目标像素给一个模板,该模板包括了其周围的临近像素。再用模板中的全体像素的平均值来代替原来像素值。

第12 页 共 37 页

陕 西 理 工 学 院 毕 业 设 计

3.3.4 车牌定位实验结果

实验中将投影法和阈值化一起使用,处理前先做一次腐蚀,平滑和去除噪声处理,采用拉普拉 斯锐化,然后进行阀值化,再对阀值化后的二值图像进行消弱背景干扰的处理和中值滤波的处理,最后是在一个方向上进行投影运算。求取车牌子图像的上下边缘位置,对车牌图像进行剪裁,得到车牌宽度的图像。为了便于字符的分割,最后再将裁剪出的牌照作进一步处理。实验结果如图3.2至图3.5。

图3.2 腐蚀后的图像 图3.3 平滑图像的轮廓 图3.4 移除小对象

图3.5水平方向的合理区域 图3.6定位裁剪后的图像

图3.7 车牌图像的进一步处理

第13 页 共 37 页

陕 西 理 工 学 院 毕 业 设 计

4 车牌字符分割

车牌字符分割是指将车牌区域分割成单个的字符区域,以便后续字符识别算法对单个字符进行识别,其难点是模糊、断裂字符的分割。字符分割的任务主要是准确定位出车牌中每个字符的上下左右边界,将其以单个字符图像的形式分割出来,作为字符识别部分的输入。字符能否正确分割对字符的识别是至关重要的。目前字符分割的方法都是借助投影信息实现的。由于拍摄角度的影响,车牌图像会产生一定程度的倾斜,而无论左右倾斜还是上下倾斜都会影响车牌字符的分割,所以有必要对车牌进行矫正。本文提出一种垂直投影法和连通域法相结合的分割方法进行字符分割。 4.1 常用的车牌字符分割算法

标准汽车牌照上的字符间隔有一定的规律:一般车牌(军车、警车、教练车、领事馆车除外)上有7个字符,首位为省名缩写汉字,第二位为英文字母,第三~七位为英文字母或阿拉伯数字,字符总长度为409mm,其中单个字符统一宽度为45mm,第二、三个字符间隔为34mm,中间的小圆点为lOmm宽,小圆点与第二、三个字符间隔分别为12mm。充分利用这些先验知识有助于字符的准确分割。常用的车牌识别的字符分割算法主要有垂直投影法和连通域法两种。

(1) 垂直投影法

投影法利用了字符块在垂直方向上的投影必然在正确的分割位置上(即字符或者字符内的间隙处)取得了局部最小值,且这个位置要满足汽车牌照字符规则和字符尺寸限制。对牌照区域作垂直方向上投影,在水平方向上从左至右检测各坐标的垂直投影数值,当找到第一个局部最小点的时候,认为这个点是最左面字符的边界。在水平方向上从右至左检测坐标的垂直投影数值,当找到第一个局部最小点的时候,认为这个点是最右面字符的边界。得到两边字符的边界之后,用同样方法可以找到每个字符的边界。如果单纯采用投影法的话会造成字符的分割过度,将一个字符的两个部分分 割开来。我们可以利用一些先验知识来做进一步的处理,通过最左和最右面两个字符的边界我们可以估算出整个车牌区域的宽度,标准车辆牌照由7个字符组成,大约为8个字符宽,我们可以利用这些先验知识估计出每个字符的大概宽度,然后把分割过度的字符进行合并,这样可以取得较好的分割效果。

(2) 连通域法

每一个字符或者字符的一部分构成一个连通域,把这些连通域分割出来,也就分割出单个字符了。车牌上的字符一般除了一个汉字外,其它的都是字母或数字,即在理想状态下是“全\连通的,因此使用连通域的方法对车牌字符进行分割是一种常用的算法。对第一个字符可以利用位置,大小等信息进行连通域的合并。但在实际情况中,很多车牌的噪声非常大,极端的情况是连人眼都分辨不出来,单凭连通域很难取得让人满意的结果。于是在其基础上加上了很多改进方法,例如二值化方法的改进,由于车牌是固定的几种颜色的组合,利用彩色二值化更有目的性和针对性。也可以考虑利用车牌本身的先验知识对连通域进行合并或者分割。另外对字符粘连所产生的大的连通域可以考虑重新选取阈值再进行分割。采用了这些改进方法也能取得较好的分割效果。 4.2 垂直投影法

算法流程图如图4.l所示。 具体算法如下:

1.计算每一列在上下界之间所有象素点值为0的个数,即垂直投影; 2.从左至右寻找第一个不为零的局部最小点作为第一个投影块的左边界; 3.再往右寻找恰好为零的点作为第一个投影块的右边界;

第14 页 共 37 页

陕 西 理 工 学 院 毕 业 设 计

4. 对每个字符进行切割。

5.判断投影块个数是否大于7;若大于,则说明车牌的字符有断裂,需要进一步合并投影块;若小于7,则继续进行。

6.计算每个投影块的宽度;若宽度小于等于阈值,则直接输出;若宽度大于阈值,则转到3继续切割。

7.输出每个切分后的字符。

对图像进行垂直投影 从左到右,找到每个投影的左右边界 进行切割 是 投影块个数是否大于7 否 计算每个投影块宽度 合并投影块 否 宽度是否大于阈值 是 输出每个切分后的字符 图4.1 字符切分算法流程

本文面向车牌区域的字符分割算法有效地克服了过度分割和字符粘连的现象,但是由于光照强度和天气情况等多种因素的干扰,有些情况下难以得到令人满意的二值化效果和字符分割结果,在这种条件下可以采用回溯的方法:将字符识别的结果返回字符分割部分来验证字符分割结果是否正确,如果不正确可以考虑重新二值化,合并过度分割的字符部分或者继续分割粘连的字符。实验结果如图4.2。

图4.2 字符分割结果

第15 页 共 37 页

陕 西 理 工 学 院 毕 业 设 计

5 车牌字符识别

5.1 车牌字符识别原理及组成

字符识别模块是整个系统中最核心的部分,是系统的最终实现目标,前述各个模块都是本模块的基础。车牌字符识别是从属于光学字符识别(OCR)的一个特殊问题,可以利用OCR的原理和方法来进行车牌字符的识别。 5.1.1 模式识别与车牌字符识别

1.模式识别理论概述

模式识别是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。计算机模式识别在20世纪60年代初迅速发展并成为一门新学科。

车辆牌照字符识别属于模式识别领域的一个分支,采用的是模式识别的经典理论和方法。通常的模式识别过程可以概述为:从测量空间映射到特征空间,再映射到模式空间。对于一般的字符识别过程来说,识别过程为:从输入的待识别字符(样本)点阵图形提取描述该字符的特征,再根据一定准则来判定该样本所属的模式类别。因此字符描述,特征提取与选择,分类判决,是字符识别的三个基本环节。在本文中主要讨论特征提取和分类判决两个部分。目前主要的字符识别技术是:统计模式识别和结构模式识别,它们之间又存在一定的联系和借鉴。

统计模式识别理论是模式识别中最完整的理论体系,具有很多有效的方法。其要点是提取待识别模式的一组统计特征,按照一定的决策函数进行分类判决。常用的统计特征有字符二维平面的位置特征、字符在水平或者垂直方向投影的直方图特征、矩特征和字符经过频域变换或其它形式变换后的特征等。识别方法首先将大量字符的统计特征经过提取、学习、分类形成模板信息,存储在识别系统中。待识别图像在识别时首先利用相同的方法提取统计特征,然后与识别系统中存储的字符模板进行匹配比较,根据比较结果确定字符分类结果。其中匹配程度的衡量指标常采用各种向量间的距离,比如欧氏距离、街区距离等。基于统计特征的字符识别技术对于形近字符区分能力弱,因此,通常应用于字符的粗分类。对于识别字符集比较小、输入图像质量比较高的图片也可以担当主要的识别任务。

结构模式识别也称为句法模式识别。在很多情况下,对于较复杂的对象仅用一些数值特征已不能较充分地进行描述,这时可采用句法识别技术。这种技术也同样包括提取特征、识别过程。首先要提取字符的结构特征,比如笔划的走向、孤立的点,以及是否含有闭合笔画等。识别过程是在提取基元的基础上利用形式语言,采取词法分析、树匹配、图匹配和知识推理的方法分析字符结构的过程。结构模式识别主要应用在汉字识别系统中,主要出发点是汉字的组成结构。汉字由笔划(点横竖撇捺等)、偏旁部首或者更小的基元构成的,识别时利用上述结构信息及句法分析的方法进行识别,类似一个逻辑推理器。这种方法的优点在于对字体变化的适应性强,区分相似字能力

强;但是在实际应用中,面临着抗干扰能力差的问题。由于在实际得到的文本图像中存在着各种干扰,如倾斜、扭曲、断裂、粘连、对比度差等,这些因素直接影响到结构基元的提取,假如结构基元不能准确地得到,后面的推理过程就成了无源之水。此外结构模式识别的描述比较复杂,因而匹配过程的复杂度比较高。

结构模式识别与统计模式识别各有优缺点,随着我们对于两种方法认识的深入,这两种方法正在逐渐融合。网格化特征就是这种结合的产物。字符图像被均匀或非均匀地划分为若干区域,称之为“网格\,然后在每一个网格内寻找各种特征,如图像前景点与背景点的比例、交叉点、笔划端点的个数、细化后的笔划长度、网格部分的笔划密度等等。特征的统计以网格为单位,即使个别点的

第16 页 共 37 页


基于数字图像的车牌识别系统设计(4).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:中考英语课本复习考点归纳

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: