中北大学2014届本科毕业论文
3 蔬菜图像的特征提取
特征提取是计算机视觉和图像处理中的一个概念。它指的是使用计算机提取图像信息,决定每个图像的点是否属于一个图像特征。特征提取的结果是把图像上的点分为不同的子集,这些子集往往属于孤立的点、连续的曲线或者连续的区域。特征抽取的主要思想是将原始样本投影到一个低维特征空间,得到最能反应样本本质或进行样本区分的低维样本特征。
常用的图像特征有颜色特征、纹理特征、形状特征等。颜色是物体表面的属性,因此对于目标识别的研究具有非常重要的意义。纹理是物体表面的结构模式,
可以认为是颜色在空间以一定的变化形式而形成的图案。形状特征也是另外一个描述物体的重要特征.本设计分别对3种特征进行了研究。 3.1 颜色特征提取
颜色是图像非常重要的视觉特征,是人识别图像的主要感知特征之一。相对于其它特征,颜色特征对于图像的平移、尺度、旋转变化不敏感,具有很强的鲁棒性,而且计算简单。它是一种全局特征,描述了图像或图像区域所对应的景物的表面性质。一般颜色特征是基于像素点的特征,此时所有属于图像或图像区域的像素都有各自的贡献。由于颜色对图像或图像区域的方向、大小等变化不敏感,所以颜色特征不能很好地捕捉图像中对象的局部特征。另外,仅使用颜色特征查询时,如果数据库很大,常会将许多不需要的图像也检索出来。
颜色直方图是最常用的表达颜色特征的方法,其优点是不受图像旋转和平移变化的影响,进一步借助归一化还可不受图像尺度变化的影响,基缺点是没有表达出颜色空间分布的信息。此外,还有颜色集、颜色矩、颜色相关图及颜色一致性矢量等方法来表达图像的颜色特征。本论文选用颜色一致性矢量(CCVs)这种方法。 3.1.1 颜色一致性特征矢量CCVs
针对两幅不同的图像可能存在着相同的直方图而引出了颜色一致性矢量的概念。这种方法不仅统计了整副图像中各颜色的像素值,还统计了图像中每个颜色最大区域的像素值,效果较好。但没有强调各颜色最大区域的形状以及与背景的关系。把各颜色通道的像素值量化到n个范围之内,像素值处于第i段的个数为:?i??i,由此可得:
1??1,?2??2,...,?n??n>
- 17 -
中北大学2014届本科毕业论文
其中?i为相关的像素点个数,?i为不相关的像素点个数,所以颜色一致性矢量[10]的形式为:
?1,?1?,??2,?2?,...,??n,?n?>
例如:
21 12 18 12 13 11 2 1 1 1 1 1 21 12 13 29 15 12 2 1 1 2 1 1 24 11 31 23 17 13 2 1 3 2 1 1 27 23 22 11 16 27 量化 2 2 2 1 1 2 28 25 11 17 21 26 2 2 1 1 2 2 25 21 15 10 21 22 2 2 1 1 2 2
B A A A A A B A A B A A B A C B A A 连通标记 B B B A A B B B A A B B B B A A B B
图3.1 颜色一致性矢量计算
表3.1 颜色一致性矢量对 Color 1 18 0 2 12 5 3 0 1 ? ? 因此,上图颜色一致性矢量为: 18,0?,?12,5?,?0,1?>
算法说明:
提取颜色一致性矢量(CCVs)的步骤:
①:对灰度图像进行模糊化处理,使相邻区域的像素值不至于差别过大(使用中值波)。 ②:对像素值空间进行均等划分,如区间1包含像素值为0-7的像素,区间2包含像素
值为8-15的像素,依次类推。(划分为32份)。
③:使图像中各像素位置标记其所属的像素值空间(1-32),如(图1)所示。 ④:统计出属于同一连通域中的像素个数。
⑤:设定阈值T,作为判断是否具有区域一致性的标准。
- 18 -
中北大学2014届本科毕业论文
算法中最关键的步骤是统计某一连通区域的像素个数,这是一个涉及到数据结构中遍树的问题,其算法流程图如图3.2所示。
- 19 -
中北大学2014届本科毕业论文
开始 寻找初始像素点 保存第一点坐标,将该点的像素值置为255 (注,像素值区间划分后,将图像的像素值置为区间值,因此图像内最大像素值为32) 8邻域搜索 是否找到 N Y 像素值置为255,8邻域搜索 是否找到 Y N 返回上一点 N 是否为起始点 Y 结束 图3.2 求某连通域像素个数的算法流程图- 20 -
孤立点
中北大学2014届本科毕业论文
实验结果:
选取一致性判断阈值T为20(即当某一连通域中的像素个数值大于20时,则判定该区间内的像素具有一致性,否则为非一致性)。由于需要处理的图像,背景像素值为0,因此不统计像素值为0的像素,仅仅是对前景像素进行统计。对分割后的黄瓜图像进行实验,提取其颜色一致性矢量,结果如图3.3所示:
黄瓜17000一致性像素非一致性像素 8000700060005000一致性像素非一致性像素黄瓜2 60005000统计个数统计个数5101520像素值区间25303540004000300030002000200010000 010000 0 5101520像素值区间253035 黄瓜37000一致性像素非一致性像素 黄瓜48000700060005000一致性像素非一致性像素 60005000统计个数统计个数5101520像素值区间25303540004000300030002000200010000 010000 0 5101520像素值区间253035 图3.3黄瓜图像提取的颜色一致性矢量 设两幅图像的颜色一致性矢量分别为
<(A1,B1) ,... , (An,Bn)>和<(A1*,B1*) ,... , (An*,Bn*)>
利用公式:
?H=?|Aj?Aj*|?|Bj?Bj*| 式3.1
j?1n来比较两幅图像之间的差别。对黄瓜,萝卜,西红柿图像,分别以种类中的某一副图像的特征矢量代表该种类的特征矢量,其他图像分别与该图像进行比较,找出与之差值最近的图像,结果如图3.4所示。
- 21 -