通过自适应训练方法对人体复杂行为模式进行识别和跟踪 - 图文(3)

2019-09-01 19:22

通过使用这样的参数化我们能够在满足生理表达的要求下，使脊柱尺度从21减到9个自由度。用来跟踪的减少尺度后的模型由51个自由度组成（或忽略手和脚后的41个）。Fig 6展示了一些我们修改后的RAMSIS模型能达到的极度脊柱变形后达到的弯曲程度。

Fig 6 修正骨盆后脊柱关节的动作极限。通过旋转骨盆可进一步增加弯曲程度。

生物力学的帧间动作极限我们使用生物力学的研究估计了这个模型的每个身体部分最快角速率(Engstler et al. 2009)。这项研究中，一个人体目标以最大速度演示预先定义的隔离动作（即分别演示每个自由度），同时使用2个高速视频摄像机以250帧每秒的速度记录。我们的估计基于围绕动作范围中心，手动调节关键帧之间测量的偏差派生出来。另外，我们使用从运动科学中基于标记的动作捕捉数据改善我们的估计。

为了跟踪应用，举例来说，做一些随机搜索，通过考虑摄像机记录的每秒帧数，最大角速率可以被转换成角帧间标准差。

姿势计算的缓存另一个有助于改善计算效率的优化是身体部分依赖于姿势计算的缓存。通过保存之前的姿势计算在存储器中起作用，包括局部坐标系统，表面顶点的3D坐标，和2D平面图像推测。无论何时为模型提供新的姿势，相比于上一个计算的姿势参数改变的所有身体部分是无效的。另外，这些身体部分的相关部分即没有运动前例的部分也是无效的。这样的修正与4.3节介绍的分层粒子滤波结合使用十分有效。这些算法只需为大数量的平行评估重复修正部分参数空间。并且缓存有助于减少需要计算的操作数量（实践中大约四分之一）。

11 / 47

相比于现存的其他人体测量的人体模型如SCAPE(Anguelov et al. 2005; Balan andBlack2008)，较低的计算量需求和可得的内在骨架，无疑使修正的RAMSIS模型在跟踪应用中更受青睐。另外，RAMSIS的扩展应用如使用内部和外部压力的姿势预测和不适(Seitz et al. 2005)也为进一步研究提供了机会。

四、人体姿势跟踪

现在我们将讨论为人体姿势跟踪我们的模板策略的关键构成。注意我们认为人体动作跟踪是高维检索这一合理性，考虑到在贝叶斯估计中后部密度的较好近似难以得到。这归因于复杂的高维分布难以被解析，事实上几乎不可能近似的使用离散采样或直方图来描述。而且，局部模式的现状和精确产生任意人体动作类型的困难为微分法优化手段提出了艰难挑战。一个好的策略是合并粒子滤波和采用优化手段的技术的并行开发能力(Deutscher and Reid2005;Brayetal. 2007)。我们将从贝叶斯观点提出这样一种策略。

4.1 粒子滤波

Fig7 图解介绍了传统采样重要性重采样粒子滤波（SIR）来递归贝叶斯估计的步骤(Arulam-palam et al. 2002)。在粒子滤波中，后部概率密度函数表姿势

在时间t给出一系列图像观察值

代

直到时间t被描述为一组N重加权

的粒子=

跟踪，即使用动作模型

,是标准权重。通过预测每个粒子新的状态实现

在更新权重之前按照现在观察的可能性

预测新状态。为防止粒子集退化，每个时步的重采样是必要的

(Arulampalam etal. 2002)。

12 / 47

Fig 7 采样重要性重采样的步骤。先前时步的加权粒子集经过重采样创建未加权的集，该集的粒子是通过它们权重的概率比例提取出来的。重采样粒子用来按照动作模型预测新状态。最后一步中，粒子权重按照当前观测值升级。最终状态估计

我们感兴趣的是跟踪任意动作，在我们的应用中使用以下动作模型(一阶马尔科夫)：

（1）

这里，是一个对角矩阵，对角线元素与x构成的

的方差

一致。方差

可以从新产生的权重粒子集中计算得到。

影响每个姿势或关节角度在状态向量x下的扩散量。我们在第3部分已经按照生物力学的内部框架动作极限将我们模型的这些参数进行了初始化。权重升级

通过比较粒子状态呈现的投影掩

模与使用背景减法得到的前景掩模完成（Fig 8）。预测状态的不一致像素相应为错误率

：

（2）

这里，XOR表示像素对称差异运算符，作用于所有平行摄像机的图像面。COUNT运算符计算所有摄像机的非零像素。最终权重

通过随后的标准化处理使数值

在0（遭遇最高错误）和1（遭遇最低错误）之间。当使用不少于三台摄像机和一个适宜的人体形状模型时，这个可能性模型提供了很好的实验结果。

13 / 47

Fig 8 通过比较由背景减法得到的前景掩模（上面一行）与投影掩模（下面一行），估计预测状态4.2 多层搜索

单纯SIR粒子滤波在人体动作跟踪问题中是不可用的，因为必要粒子数目随着状态空间的维度呈指数增长。Deutscher and Reid (2005)提出多层搜索策略，与模仿退火(Kirkpatricket al. 1983)关联来克服这个问题。该方法关注围绕在概率密度函数的（全局）模式粒子，本质上与优化手段十分相似。退火粒子滤波（APF）在Fig 9 图示说明。经过M次迭代，粒子集朝着最终集进化。随着每次迭代，扩散系数δ在预测阶段被引进（公式 1）加权一个系数如αm (比如0.5)减少不确定性。同时,加权函数

通过用退火方案的值

增加，粒子由

的可能性。

进行幂运算来锐化。随着每次迭代

大范围存在向最适宜聚集发展，这样有助于克服早期迭代局部最大化问题，向着后来的模式聚集。

14 / 47

Fig 9 退火粒子滤波的一个时步。最终粒子集经M次迭代估计。每次迭代相对采样重采样步骤（SIR），这里使用每次迭代的因子

来减少预测阶段增加的扩

退

散量（即不确定性），并且权重函数在升级阶段按照方案

火。这个退火方案逐渐锐化权重函数并缓慢推动粒子朝着全局最大化发展。

退火粒子滤波（APF）短期跟踪实验的很好表现已经被报导了(Deutscher and Reid 2005)，但是实验显示APF在同时评估所有维度时仍然需要指数数量的粒子(Bandouch etal. 2008)。通过协方差规模扩散更有效的使用粒子，扩散向量从状态协方差矩阵

中采样得到,协方差矩阵从粒子集

的最后一次迭

代（除非当m=M时）中估计得到。因此，扩散可根据参数已经被估计的适宜程度自适应调整，并且搜索聚焦在最佳参数还未被决定的区域(Deutscher and Reid 2005)。Sminchisescu andTriggs (2003)提出了类似想法，文章中提到单眼跟踪时，粒子倾向于沿着不可观察的方向扩散。实践中，扩散向量通过以下方式采样：

（3）

（4）

公式3中，我们完成矩阵

即特征向量，

的特征分解（如通过奇异值分解），列向量为对角矩阵，对角线元素为特征值。然后，

由标准正态分布随机变量采样构成随机向量 Z ，乘特征值的平方根，就将特征向量空间转换成状态空间（公式4）。 4.3 分层划分

尽管协方差规模扩散提供了一定的分层，但是退火粒子滤波的问题是所有状态参数实际上依然被平行估计了。尤其当人体动作模型包含分层依赖参数（如肘部

15 / 47

共10页:

通过自适应训练方法对人体复杂行为模式进行识别和跟踪 - 图文(3).doc 将本文的Word文档下载到电脑下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档