比度,方向性,线像度,规律度和粗略度。狭义上来讲,纹理即是粗糙度。当两幅图像仅大小不同时,尺寸大的图像拥有更加粗糙的纹理。图像的尺寸越大并且(或者)像素重复的越少,图像就更加粗糙。A.Rosenfeld等在Tamura之前便对粗糙度开始研究。当图像f(x,y)乘以一个系数c变成cf(x,y)后,图像的对比度改变。当两幅图像只有灰度像素值分布不同时,可以采用对比度加以区分。某种程度上,对比度代表着图像的质量。方向性是图像的整体性质。Bajcsy将其分为单向性和双向性。线像度与纹理图像的轮廓相关。它是上述三个纹理特征的补充。一般情况下,自然界中图像规律性不明显,拥有良好纹理的图像具有规律性。粗略度与触觉相关。文献[21]中选取16种不同的纹理图像,按照六种不同特征分量人为对图像进行分类,与实验结果比较,结果证实Tamura纹理特征提取算法的有效性。
GLDM由R. M. Haralick等提出,可以表征图像全局特征。GLDM是第二级联条件概率密度函数。同次性、能量、熵和对比度等可以用来表征图像纹理。反应了影像灰度关于方向、相邻间隔、变化幅度等综合信息。由Harlow等理论证实具有最好的“先天性判别力”。Weszka在GLDM的基础上提出灰度差统计算法(Gray-Level Difference Statistics, GLDS),并证实其算法较GLDM简单易行并且效果优于GLDM。
Laws纹理能量测量法根据单个像素及其邻域的灰度分布或某种属性作纹理测量,是典型的一阶统计分析方法。文献[22]选用性能最强的4个滤波模板与图像分别进行卷积,滤出水平边缘、高频点、V形状和垂直边缘等。小波分析是提取纹理特征的有效方法,它能反应出图像的低频信息和在水平、垂直和对角上的高频变化,能在一定程度上体现出不同图像纹理的差别,可以解决多特征组合的问题。Dalal,N等的HOG[23]也是目前常用的基于纹理的直方图特征统计算法,它们都是基于直方图进行计算,通过使用区域快速算法来提高特征提取的效率,从而降低时间耗费。
基于边缘的特征提取算法对光照强度变换的敏感程度低于基于颜色的特征提取算法。常用的边缘提取算子有Canny边缘提取算子和Robert边缘提取算子等(图2.3)。有时对于特定的目标检测或跟踪,边缘特征足以将目标区分开来。但是边缘特征对于光影的变化较敏感,在树阴下、草丛等类似边缘信息极为丰富的环境中,目标的外观可能改变的场景中(目标为行人,行人穿多种颜色衣服或一种颜色衣服的情况),边缘提取会产生较多噪声,不利于特征描述。
图2.3 边缘提取图
a) 原始图像 b) Robert算子边缘图 c) Sobel算子边缘图
特征提取后,提取的特征向量在高维空间。将特征向量映射到低维空间是分类的过程。当特征向量维数较高时,系统处理的时间和复杂度都将提高。在分类之前有必要对数据进行降维。降维可以使同类之间的数据更加紧凑,不同类之间的数据更加分离。它抽选出最具有区分度的特征供模式分类或模式识别。降维是提高系统处理速度和准确率的一种有效手段。目前常用的降维方法有主成份分析(Principle Component Analysis, PCA)[24]、ICA[13]等。
图像特征提取是进行目标分类、检测、识别和跟踪的前提。目标特征提取算法的好坏,直接影响最后准确率。不同的特征提取算法有不同的应用场景。对于目标检测、识别和跟踪来说,颜色特征提取算法是常采用的算法之一,尤其在目标跟踪中。但是除了光照等因素外,还存在其它外在因素导致目标颜色变化,一些内在因素也会导致目标颜色的变化。并且基于颜色的特征提取算法缺少目标的整体空间信息,在某些情况下,无法区分目标与非目标。在目标检测和分类中,纹理特征提取算法也是常采用的特征提取算法之一,因为目标的颜色可能改变,但是目标的整体框架没有太大的变化。有效地提取图像特征,独一无二表征目标是本文研究的重点之一。
2.2 密度等级分类方法
图像密度等级分类在保障客流人身安全方面有重要作用,具有实际研究意义。在密度等级较高的情况下,可以采用监控人员干预;密度等级较低的情况下,可以采用图像视频处理,对降低劳动强度亦有一定的帮助。
2.2.1 常用图像分类方法
密度等级分类的难点在于如何避免邻居类间的误判情况。例如,如何避免将中高密度等级分类到高密度等级或中密度等级。图2.4中给出了地铁人群低密度和高密度情况。由于摄像头架设和地铁空间布局因素,本文对图2.4中两条线内
区域内进行分析。目前常采用的方法有分形维数和纹理分析等,根据图像中人数来判断图像密度等级也有人进行研究。分形维数的一个缺点在于无法对高密度等级的图像进行分类,因为高密度等级的图像的分形维数不可分。纹理分析能够很好表征图像特征,是目前最流行的一种密度等级分类算法。由于如何精确判断图像中人数本身就属于一个难题,所以根据人数来判断图像密度等级需要进一步研究。
不同的图像有不同的分形维数。分形维数可以用来表征图像特征,因此分形算法可以用来对图像进行分类。二值化后的边缘图可以用来计算图像的分形维数
[1]
。对原始图像经过灰度变换后进行边缘分析,采用Robert算子计算边缘图像。
Robert原理如公式2.3所示。
图2.4 地铁人群低、高密度情况
?0?2?1? (2.3) 3??公式2.3中像素点0经过Robert算子计算后的值如2.4所示。
P0?(P0?P3)*(P0?P3)?(P1?P2)*(P1?P2) (2.4)
公式2.4中P0,P1,P2,P3代表公式2.3中四个像素点的像素值。图2.5是经过Robert算子运算后的边缘图像。
图2.5边缘图
边缘检测后,对边缘图进行二值化,二值化可采用OTSU[10]算法。OTSU方法在获得图像灰度直方图条件下,利用概率论知识,通过计算最大类间方差而得到分割门限。经过OTSU二值化算法后,得到的二值图如图2.6所示。
图2.6二值图
经过不同的膨胀系数膨胀后的二值图有不同的白色像素,根据不同膨胀系数和膨胀后二值图的白色像素数之间的关系可以用来计算图像的分形维数。不同分形维数对应不同的密度等级图像。
图2.7不同膨胀系数二值图
在图2.7中,第一列到第五列分别为原始图像、边缘二值图、膨胀系数为1、膨胀系数为8和膨胀系数为15的二值图。根据膨胀后的二值图,可以得出图2.8的结果。
图2.8 图像分形维数
在图2.8中,横坐标代表不同膨胀的系数取ln对数;纵坐标代表图像中白色像素点总个数取ln对数;拟合后的直线斜率即为图像的分形维数。图2.8中三角形特征点拟合成的直线代表高密度图像的分形维数;菱形特征点拟合成的直线为低密度图像的分形维数;正方形特征点拟合成的直线代表中高密度图像的分形维数。分形维数可以用来表征图像特征,但是当人群密集时,密度等级高的图像具有相近的分形维数,很难根据分形维数判断密度等级。
根据纹理分析来进行图像密度等级分类也是目前常用的一种算法。此种方法可以归类为特征提取后应用分类器分类的算法。在2.1节介绍了目前常用的特征提取算法,其中纹理特征能够表征图像的类别,是一种比较好的特征。经过特征提取后,分类器对提取的特征进行分类。目前,较常流行的分类器有神经网络,SVM等。其中神经网络又分为BP神经网络,自组织神经网络等。
自组织神经网络[2]是一种无教师示教的竞争式学习网络。它分为输入层和竞争层。输入层与竞争层之间实行全互连接,有时竞争层各神经元还实行侧抑制连接。自组织神经网络能将任意输入模式在竞争层映射成二维离散图形,并保持结构不变。文献[2]使用自组织神经网络来分类图像密度等级,以增加算法复杂度和识别时间为代价来提高准确率。
SVM是一种二值分类器,在二值领域取得了较好的应用,并在小样本模式识别问题上具有特有的优势。SVM也可以用来对多模式进行分类。设需要分类的模式为N,则需N?1种SVM分类器。文献[8]使用SVM来分类图像密度等级,但是当需要区分较多种类时,无论是训练或分类SVM都比较繁琐。
径向基神经网络与BP神经网络类似,但只有一层隐层和一个输出节点。输出节点的值是隐层各个节点输出的加权和。隐层节点的作用函数是径向基函数,输入节点到隐层节点的权值固定为1,隐层节点到输出节点间权值可调。
贝叶斯分类器是一种基于概率模型的分类器。理论上讲,与其它所有分类算法相比,贝叶斯分类出错率最小,然而实践中并非总是如此。这是由于对其应用假设存在不准确性,以及缺乏可用概率数据。文献[3]中,采用贝叶斯分类器取得了很好的结果,但是假设每类分布概率相同。
文献[1,3,4]采用纹理分析进行图像密度等级分类。分类器采用自组织神经网络来进行特征分类。纹理分析对高密度图像的可分情况较分形维数好。但在邻居类间误判情况较常发生,是影响准确率的主要因素。
可以根据计算得出的图像中人数或者客流的流量判断密度等级。文献[9]根据SVM分类器来计算图像中人数,以达到计算密度的目的。但是由于流量的准确率较密度分类准确率低,直接计算图像密度等级方法准确率高。
2.2.2 主要问题
对于图像密度等级分类来说,主要的难点在于如何避免邻居类之间误判的情况和高密度时图像密度等级分类情况(图2.9)。目前较流行的算法均能有效的避免非邻居类之间的误判,但是邻居类之间的误判率较高,研究一种有效的算法解决此问题称为图像密度等级分类的重中之重。