人体模型RAMSIS是外观精确性和计算高效性的一个很好的折中。它的参数化直接来自于利用绝对和动态的关节极限,设置内在骨架的关节角度((Herda et al. 2004展示了如何利用关节极限改善跟踪精确性)。
为了适应人体姿势的高维状态空间以及由此导致的估计参数上的困难,许多方法利用机器学习技术来解决这个任务。在最简单的例子中,可以优先学习特定动作,跟踪时来限制搜索空间。一些方法项目训练动作时从高维状态空间到多方位的低维空间,这需要采用一些技术,如基本原理成分分析方法((Urtasun and Fua 2004),或高斯过程动态模型(Urtasun et al. 2006)。多方位低维的动作以可生产的方式创造下一个状态的预测(Siden-bladh et al. 2002)。我们的工作中,使用动作图表((Ko-var et al. 2002))能够指定观察到的姿势最可能的后续状态,但我们省略了为短期预测的限制相关性植入低维的计算(6.1中介绍)。
另一类基于标准的方法(Grauman etal. 2003; Agarwal and Triggs 2006;Boetal.2008)直接从观察到的图像特征与人体姿势一致的部分绘图得出,易于实施和应用。这样的手段受限于必须是训练过的特征类型,而且根据环境下不同摄像机视角必须重复训练。
对人体动作捕捉相关工作方面更综合的总结由来自于Gavrila (1999), Moeslund et al. ( 2006) and Poppe ( 2007)的调查提供。
行为识别行为识别目的在于为人类动作模式分派更高水平的语义标签,帮助识别进行中的活动和意图。
无模型的手段直接从图像线索和行为种类中绘图,无需中间参数估计的步骤。整体分析将图像信息视为一个整体,例如,使用剪影(Bobickand Davis2001)边缘图像或光学流场(Efroset al. 2003)。Bobick and Davis ( 2001)介绍了一种运动历史图像motion-history-images方法,是对动作的2.5D表述,该方法中使光照适时与距离相对应,剪影与一个单一图像相重合。空间时间形状Space-time-shapes (Gorelick et al. 2007)或时空体积spatiotemporal vol-umes(Yilmaz and Shah 2005)方法是使用时间作为第三维度提取剪影。Weinlandet al. ( 2006)创建了一种对人体动作不依赖视觉的表述,通过对多个摄像机拍摄的的轮廓融合获得视觉船(vision hull),然后用临时信息扩增至3.5D运动历史卷的形式。与整体方法相反,基于分支的方法仅提取筛选出的显著特征,然后分类,有助于克服部分遮挡的问题
6 / 47
(Oikonomopoulos et al. 2006)。
在基于模型的方法中,在相空间表演动作分类之前的第一阶段,典型模型的参数是决定性的。动作分类最常用的参数是铰接人体模型的关节角度或关节位置(Sheikh et al. 2005;Kuli′cetal. 2008)。这些参数具有移动、规模、旋转不变性。而且形成人体运动的丰富和全面的表述。它们更适用于识别,并且对更细微的运动能提供更高的识别率。但是,模型参数通过非入侵手段提取非常困难,大部分参数检索手段依靠商业性的基于标记的动作捕捉系统。我们使用的无标记跟踪系统通过匹配动作片段对行为分类,该动作片段由关节位置的短时间序列到标记的范本计算得出(第6节)。
关于人体行为识别的更多详细的调查由Krüger et al. ( 2007) and Poppe ( 2010)提供。
三、人体测量的人体模型
在我们的工作中采用新方法整合数字人体模型RAMSIS(Seidl 1994; Bubb 1997)来跟踪人体动作(Fig 4)。RAMSIS是一个先进的并经过人类工程学领域的工业证明的模型,在各领域尤其是自动化领域被广泛使用。它最初用于基于CAD设计的汽车内部和人的工作区间的自由移动,同时应用于人类工程学的研究。使用这个模型有以下优势:
1、 此模型能够按照人体测量考虑捕捉不同身体类型,比如人类广泛的不同外观。它的设计经过了来自这个领域顶尖专家基于人类工程学因素的指导。
2、 内部关节的位置与真正的人体关节位置精确相符,因此是动作分析任务的理想选择,如体育分析或人体工程学研究。 3、 这个模型在保留正确外观的情况下,能够捕捉绝大部分人体可完成的运动。并且整合了绝对动作极限,有助于减小跟踪时的检索空间。可以使用人体测量学知识查询种群动作极限的不同百分率。
此模型由与真正人体骨骼类似的内部力学模型(Fig 3)以及表现人肉体和皮肤的外观模型(Fig 4)组成。主要的模型定义由几方面组成:身体部分的分层;身体关节的相对位置;相应于本地坐标系的表面顶点;身体部分的绝对动作极限。在RAMSIS模型发展的一开始,所有相应的参数已经是确定的规定好的。另外,
7 / 47
变量参数描述模型的姿势(依赖于潜在的力学结构),描述模型的形状(基于米制长度值,在模型定义中为相对位置提供绝对规模)。
Fig.3电子人体模型RAMSIS的内部力学结构。a中表现的是坐标系各局部,b中是手臂和脊柱。
Fig 4 RAMSIS不同体型和性别的外观模型。
现在我们将描述在尊重原始RAMSIS模型的规定下优化我们的模型,是根据动作跟踪应用的特定需要定制的,比如文中稍后将提到的一些。
8 / 47
学习形状参数针对不同的人体测量(身高,体型,体重等)设置形状参数,模型的内部和外观就可以得到调整。这部工作通常在着手初始化阶段完成。在
RAMSIS的原始模型规格说明中,共提供了643个形状参数(43个内部参数
和600个外观参数)。绝大部分针对形状上的参数模型的局部改动,尤其是
外观参数仅影响几个外部顶点的设置。这样的超参数化使模型难以根据直
观上不同人体形状进行调整。
为了减少形状参数的数量,我们通过原理成分分析(PCA)方法统计分析了这些参数。我们使用N=139个不同的男性模型,根据人类工程学研究涵盖了大
范围的人体形状。组成N的基本成分是形状参数,
维度d是协方差矩阵解从
的特征向量。特征向量可以通过奇异值分
分解成
。
中获得。奇异值分解的方法是将半正定对称矩阵如
列向量U=()与所需要的特征向量一致。另外,是一个对角矩
阵,特征值是对角线元素。
主要成分构成的正交空间提供了人体形状的可变参数化。通过忽略与特征向量较小匹配的主成分,我们可以省略不相关的参数达到减少参数数量的目的。设
9 / 47
置参数数量的一个公共准则基于训练集方差的百分比,可由前x个主成分描述。每个主成分的方差在方向上与特征值一致。Fig 5 描绘了积累方差作为前x个特征向量的函数。
Fig 5 描绘了通过形状参数的主成分计算出的方差。累积描绘了前x个特征向量计算出的训练集方差的总百分比,当估计所有643个形状参数,仅600个外
观参数并了
或者仅43个内部参数 。另外,每个特征向量的方差的描绘合
为了使手动初始化形状参数更容易,我们进一步计算了特定躯干和四肢的主成分。可用来在图形用户界面进行快速模型调整。
脊柱运动的耦合我们已经尽可能的减少了原始RAMSIS模型的自由度,来减少跟踪高维铰接模型的复杂度。当四肢建模已经使用尽可能少的必要参数来表达所有可能姿势时,进一步减少参数的潜力应考虑到脊柱参数。在RAMSIS中,脊柱通过7个独立关节(包括头部)建模,每个关节有3个自由度。尽管在人体骨骼中,脊柱是一个耦合结构,仅允许严格受限制的运动集。如不可能在几个相对方向弯曲脊柱。为提供脊柱类似生理上的连接,我们把它分为低位脊柱,高位脊柱和头部。属于每一组的关节基于它们的绝对动作极限关系插入。这样的连接是合理的,因为绝大部分的一般动作通过仅变形高位脊柱完成(如颈椎和胸椎),而低位脊柱(如腰椎)仅在高位脊柱一旦达到极限时用来支撑极度弯曲动作。
10 / 47