河南工业大学硕士学位论文
图4-1 正面灰度图像 图4-2 侧面灰度图像
在实践中,由于各种因素的影响,很难保证在拍摄时相机和被拍摄者都处在自然的地位水平,因此容易造成面部照片有一定的倾斜。因此,对照片进行处理之前,需要对其进行规范化调整,使两张照片头部处于自然水平状态,以确保正侧面照片上的同一特征点位于同一水平线上,从而可以得到统一的坐标。
对正面人脸图像可以分别取两眼内角点的坐标,对侧面图像可以分别取右眼外眼角点和右耳上边缘点的坐标,然后分别求取正侧面图像两点连线的斜率,根据斜率可以求得这两条线与水平直线的夹角,最后依据夹角把正侧面人脸图像调整到水平位置。经过调整后的正侧面图像分别如图4-3,4-4所示。
图4-3 调整后的正面图像 图4-4 调整后的侧面图像
22
基于二维图像的三维人脸建模技术研究
4.1.2 人脸图像的归一化处理
用于实验的人脸图像是通过数码相机获取的。对于给定人脸的正侧面照片,往往难以确保拍摄距离的一致性,往往会导致面部及各面部器官大小不一的现象发生,因而,在二维人脸图像的特征点提取之前需要对图像进行归一化处理,从而可以确保坐标的协调统一。对于给定照片的归一化处理步骤如下:
(1)剪切图像,去除和处理对象无关的信息,以减少图像的噪声干扰,尽可能使预处理后图像只包括头部信息。
(2)缩放图像,使两幅图像中的人头高度相同;
在获取人脸图像时,图像中人脸和各个面部器官的大小会随着拍摄距离的变化变化近似按比例缩放。所以,可以通过在正侧面二维人脸图像中选取相同位置作为基准对正侧面人脸图像进行按比例缩放,从而可以达到统一图像大小的目的。如图4-5,4-6所示,由于眼睛和嘴巴的中心线无论在正面还是在侧面图像中都很容易进行定位,并且不易受到其他因素的干扰,因此我们把眼睛中点和嘴巴中点的距离作为基准,对大小不一的正侧面人脸图像进行归一化处理。
设在正面照片中从眼睛中点到嘴巴中点的垂直距离为为
。两者之间的比例关系为
,在侧面照片中的对应距离
,根据该比例因子来调整侧面人脸图像,使其
与正面人脸图像具有统一大小,从而完成图像的归一化操作。
hf hs
图4-5 正面照片的垂直距离 图4-6 侧面照片的垂直距离
4.1.3 从正侧面照片中恢复特征点的空间坐标
经过规范化,归一化调整后的两幅人脸图像具有相同的几何高度,在正面图像中取
23
河南工业大学硕士学位论文
两眼连线的中点为基准点,可以得到面部特征点的x,y两个方向的宽度信息和高度信息,在侧面图像中取正面原点到后脑勺连线的中点为基准点,可以得到面部特征点的z,y两个方向的深度信息和高度信息。
正侧面人脸照片得到统一尺度上的特征点的X、Y、Z坐标。然后将特征点投影到正面和侧面照片上,可以计算出特征点准确的空间位置。记三维人脸模型上一个特征点的坐标为(X,Y,Z),与之对应的正面和侧面图象上特征点的二维坐标分别为(,)与(,),通过下式实现从二维坐标三维坐标的重建。
即
。
由于在两个方向上都会出现y坐标,和可能不一样,故取其平均值。
4.2 特定人脸模型的构建
一个特定人脸的建模过程是对一般人脸模型的修改过程。从一般人脸模型到特定人脸模型的变换分两个步骤,第一步是整体变换,对一般人脸模型进行整体轮廓的调整,使其与特定人脸高度,宽度和深度上相一致,且使脸部的五官位置相对应,实现模型的形似。第二步是局部变换,根据特定人脸的五官位置和形状对模型进行进一步的细致调整,使其与特定人脸在具体的人脸五官的形状和位置也相同,实现模型的神似。 4.2.1 一般人脸模型的整体变换
一般人脸模型的整体变换实际上是对模型按一定比例进行简单的坐标伸缩变换,使变换后的通用模式初步适用于特定人脸,是通过对一般人脸模型上的每一点分别在X,Y,Z三个方向的拉伸变换来实现的,X,Y,Z三个方向分别规定为:从正面观看人脸时,从左至右为X方向,从下往上为Y方向,从后往前为Z方向。据规范化后的图像分别计算出高,宽,深度之比,以相应的比例对网格模型进行整体缩放。记原模型的高宽比为,高深比为(
,
,
;人脸图像的高宽比为
,
,高深比为
,模型所在坐标系原点为O
,则有
),设人脸中心O为两眼中点与后脑勺中点所在直线与两眼中点所在直线的
),记其变换后的新位置为V(
交点,对于每一个网格点V(,
24
基于二维图像的三维人脸建模技术研究
(4-2)
整体变换后的一般人脸模型正侧面图像分别如图4-7,4-8所示。
图4-7 整体变换后的通用模型正面 图4-8 整体变换后的通用模型侧面
模型的整体变换将为后续的几何适配奠定了良好的基础。
4.2.2 几种常见的空间插值技术
整体变换后,一般人脸模型的轮廓形状和面部器官的位置与特定人脸模型的形状和位置基本相一致。由于人脸各部分器官有着各自独特的轮廓和特点,因此要完成从一般人脸模型到具体人脸模型的变换还必须以人脸面部各局部器官的特征为依据对它们进行局部变换,以便更好的描述模型的各种各样的细节。
由于本文的方法是基于一个一般模型的修改方法,为了控制和操作的可行性,试验中只从照片上得到了模型上特征点的空间坐标。 因而基本问题是: 如何通过特征点的运动来控制模型上非特征点的变化,即空间变形问题。 现有变形方法的实现主要有二种方式: 一个是自由变形技术FFD ,它的基本思想是: 首先构建一个由三维控制点形成的长方体控制框架,将要变形的对象嵌入控制框架中,并且假设对象和控制框架是由同样材料做成的,通过控制点的移动来控制框架的变形,对象也是随之变形[49]。 FFD使用长方形局部坐标系,因此控制框架一定也是长方形,从而就限制了可以实际应用的领域。 另外一种是散乱数据插值方法,即在三维通用人脸模型和特定人脸模型之间建立一个映射关系函数。根据该函数可以求出任意位置的函数值。插值算法的好坏直接关系到图像的失真程度,插值函数的设计是插值算法的核心问题。下面介绍几类常见的空间插值技术:
25
河南工业大学硕士学位论文
(1)最近邻点插值法 最近邻点插值法(Nearest Neighbor)又被称为泰森多边形方法,它是一种最简单的插值方法,该算法的基本原理是:每一个插值输出像素的值就是在输入图像中与其最临近的采样点的值[50]。其具体的数学表达式为:点与点3的距离最近,所以中间点的输出值就是距其最近的值 。
图4-9 最邻近点插值法示意图
3 2 1 ,其中
表示待输出点的变量值。最邻近点插值法的简单示意图如图4-9所示,由于待输出
最近邻点插值方法使用较为广泛,不需其他附加条件,容易实现,执行速度快,而且由于它是均质无变化的,如果被插值的数据是均匀间隔的话,用该方法进行插值很有效,并且,当被填充的区域是无值数据的区域时很有用。但是如果被插值的数据不是均匀间隔的话,很多区域将会有相同的函数值,因而往往会导致变量值的错误估计,并且由该插值算法产生的表面很粗糙。
(2)距离反比加权法 距离反比加权(Inverse Distance to a Power)插值法是最早实现的计算机内插方法,早期它是由气象工作者和地质学家首次提出的,目前仍被普遍地应用在各个方面。它的基本原理是假设平面上分布着若干个离散点,如果各个点的空间位置坐标
和它们的属性值
都是已知的,那么P点的属性值可以利用周围
分布的离散点的属性值,由距离加权插值算法求出[51]。假设P周围分布着N个数据点,则P点属性值可以由公式(4-3)求出:
式中
为N个周围数据点里面的第i个数据点到P点的
距离,在实际应用中,u一般取值为2。
距离反比加权插值法综合了最近邻点插值法和多元回归法的渐变方法的优点,能够以精确、平滑的方式实现插值算法,而且方法简便、易于实现。该算法的缺点是忽略了数据场在空间的分布情况,经常会由于采样点的分布不均而导致误差,并且如果没有根据研究区域的分布特点使用合适的加权方法的话,往往会产生比较大的偏差,因而在理论上,它属于一种纯几何性质的加权运算技术。
26