中北大学2014届本科毕业论文
知识感知等。机器视觉技术是多学科的交叉与结合,它涉及到计算机、数学、光学、心理学、生理学、物理学、信号处理等诸多学科。研究机器视觉的目的是要实现对人类视觉的模拟和延伸,换而言之,对模拟高等动物的视觉系统而言,完成对物体的形状和类别的识别是最重要的。同时计算机视觉处理的原始信息多是图像,因此该领域又和图像处理及模式识别有着十分密切的关系。
从应用的观点来看,计算机视觉这一课题的研究是很明确的:从计算机对图像分析与理解的角度,计算机视觉的任务可以划分为两个层次:低层次的方法很少使用图像内容的知识,如降低图像的噪声的图像预处理,对比度增强和图像的尖锐化;低层次的方法一般是以输入、输出都是图像为特点。高层次的方法涉及图像分割(把图像分为不同区域或目标物),从图像中提取特征(边缘、轮廓物体标识),从而完成对被识别物体的总体理解。 1.3.2 模式识别
模式识别是对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。模式识别是一种从大量信息和数据出发,在专家经验和已有认识的基础上,利用计算机和数学推理的方法对形状、模式、曲线、数字、字符格式和图形自动完成识别的过程。模式识别研究主要集中在两个方面,即研究生物体(包括人)是如何感知对象的,属于认知科学的范畴,以及在给定的任务下,如何用计算机实现模式识别的理论和方法。前者是生理学家、心理学家、生物学家和神经生理学家的研究内容,后者通过数学家、信息学专家和计算机科学工作者近几十年来的努力,已经取得了系统的研究成果。
模式识别通常包括相互关联的两个阶段,即学习阶段和测试阶段,前者是对样本进行特征选择,寻找分类的规律并进行学习的过程,后者是根据分类规律对未知样本集进行分类和识别的过程。广义的模式识别属于计算机科学中智能模拟的研究范畴,内容非常广泛,包括声音和语言识别、文字识别、指纹识别、声纳信号和地震信号分析、照片图片分析、化学模式识别等等。模式识别问题一般包括以下三种主要的方法:
统计模式识别方法:统计模式识别方法是受数学中的决策理论的启发而产生的一种识别方法,它一般假定被识别的对象或经过特征提取的向量是符合一定分布规律的随机变量。其基本思想是将特征提取阶段得到的特征向量定义在一个特征空间中,这个空间
- 2 -
中北大学2014届本科毕业论文
包含了所有的特征向量,不同的特征向量,或者说不同类别的对象都对应于空间中的一点。在分类阶段,则利用统计决策的原理对特征空间进行划分,从而达到识别不同特征的对象的目的。统计模式识别中应用的统计决策分类理论相对比较成熟,研究的重点是特征提取。
人工神经网络模式识别:人工神经网络的研究起源于对生物神经系统的研究。人类以及很多高级动物都具有很强的模式识别能力,这些都是因为它们具有发达的神经网络系统。人工神经网络是根据生物神经学原理而建立的人工网络模型,保持了生物神经网络的许多能力与优良特性。人工神经网络区别于其他识别方法的最大特点是它对待识别的对象不要求有太多的分析与了解,具有一定的智能化处理的特点。
句法结构模式识别:句法模式识别也称结构法模式识别,每个模式利用它的各个部分(称为子模式或者模式基元)的组合表示。利用模式的结构与语言的句法之间的相似性,模式的识别常以句法分析的方式进行,即依据给定的一组句法规则来分析模式的结构。句法结构模式识别着眼于对待识别对象的结构特征的描述。
在上述三种方法中,统计模式识别是经典的分类识别方法,在图像模式识别中有着非常广泛的应用[1]、[2]。 1.4 论文的主要工作
一、蔬菜图像预处理。本部分主要针对蔬菜图像背景的去除进行研究,并将所采集的蔬菜图像分两种情况:1、具有封闭外层轮廓的图像(如:包菜、萝卜、西红柿等)。2、其他图像。针对这两种图像,以K-Means聚类算法为主要的手段进行分割。
二、蔬菜图像的特征提取。本部分主要提取图像的三种特征:颜色一致性特征矢量(CCVs)、和差直方图特征矢量(SDH)、边界/内部像素分类特征矢量(BIC)。其中CCVs属于图像的颜色特征,SDH属于图像的纹理特征,BIC属于图像的形状特征。最后,利用提取出的图像特征矢量来比较图像之间差别。 1.5 论文的内容安排
第一章 绪论。阐述了课题研究的目的和意义。介绍了蔬菜识别的发展概况,以及对当
前国内外有关农产品识别的研究工作进行了简要概述。指出了本文的研究工作。
第二章 蔬菜图像预处理。介绍了图像预处理过程中几个基本的变换。确定了本文图像
分割的主要手段,即K-Means聚类算法,并对其进行了详细的阐述。
第三章 蔬菜图像的特征提取。首先对常用的图像颜色、纹理、形状特征进行了阐述。
- 3 -
中北大学2014届本科毕业论文
然后确定了本文所采用的特征提取方法,即颜色一致性矢量(CCVs)、和差直方图(SDH)、边界/内部像素分类(BIC)。并将所提取出的图像特征矢量用于图像之间的比较,验证其有效性。
第四章 全文总结与展望。对论文研究工作进行回顾总结。
- 4 -
中北大学2014届本科毕业论文
2 蔬菜图像预处理
2.1 图片数据
本论文所采用的照片大小均为640×480。每幅图像均RGB颜色空间形式存储,每一个颜色通道占用8bit。各图像均为光照均匀图像。每一种类蔬菜图像5张,分别为5种不同的摆向,共9种蔬菜。图2.1为各种类蔬菜的原始图像。
(a) 菠菜 (b) 包菜 (c) 花菜 (d) 黄瓜 (e) 韭菜 (f) 萝卜 (g) 芹菜 (h) 青菜 (i) 西红柿 图2.1 9类蔬菜的原始图像
- 5 -
中北大学2014届本科毕业论文
2.2 蔬菜图像的简单预处理
由于本设计对精度要求不高,实现图像的特征提取即可,且图像的前景与背景像素值差较大,所以本设计只对图像进行简单的灰度变换及二值处理,更多侧重图像前景的分割。
2.2.1 图像的灰度化
由于彩色图像较为复杂,使得图像处理的很多算法都没法展开,因此有必要对它进行灰度处理,即图像中的每一个像素的R、G、B值相等。图2.2为包菜图像灰度化后的图像。
图2.2 包菜图像灰度化后的图像
2.2.2 图像的二值化
在进行了灰度化处理之后,图像中的每一个像素只有一个值,那就是图像的灰度值,他们的大小决定了像素的亮暗程度,在本系统中需要获取几何形状特征参数,所以还要对已经进行了灰度处理后的图像进行二值化处理,用几何学中的概念进行分析和特征描述。蔬菜灰度图像的二值化处理方法:
设f(i,j)表示像素在(i,j)位置的灰度值,二值化可以按照下式进行:
?255 f(i,j)=?
?0f(i,j)?tf(i,j)?t 式2.1
式中t为二值化阈值。如果阈值过大会增加许多虚假信息,阈值过小有会丢失许多信息,所以阈值的选取很重要[3]。图2.3为包菜图像二值化后的图像。
图2.3 包菜图像二值化后的图像
- 6 -