北京理工大学本科生毕业设计(论文) 国外文献翻译
基于自适应模板匹配的快速目标跟踪
Karthik Hariharakrishnan and Dan Schonfeld, Senior Member, IEEE
摘要
我们提出一个目标跟踪快速算法---用运动矢量数据来预测目标物体轮廓。除了目标的初始化,在基于区域的方法中通用的分割步骤是可以避免的。我们用遮挡/遮挡恢复检测来更新目标轮廓,并用块向量预测目标边界从而实现跟踪。一种自适应的基于模板的方法已经被用于估计帧间的物体运动。一种能高效的控制帧间距的调制方案被用于运动估计。检测遮挡恢复的算法分两步进行。首先,从帧差中估计未遮挡区域。遮挡和遮挡恢复 视为二元事件并对它们的关系做出详细解释。依据二元性原理,将遮挡恢复检测算法修改使之发展成为遮挡检测算法。该跟踪算法在计算方式上要优于现存的基于区域的目标跟踪方法。实现该该算法的程序采用了MPEG - 4的视频压缩和基于H.264标准的内容检索。初步的仿真结果展示了该算法的表现。
关键字:自适应运动估计, K-均值聚类, 分割,视觉跟踪。
1
北京理工大学本科生毕业设计(论文) 国外文献翻译 Ⅰ 序言
视觉跟踪已经成为计算机视觉领域中被广泛研究的一个课题。面对新兴多媒体标准如MPEG - 4的出台,发展一个能让视频跟踪高效运行的的系统平台已经越来越重要。该视频追踪程序运用到了视频压缩,视频检索,交互视频,场景组成等等。 多种技术手段已经被运用在提取视频场景中的有意义的目标。最常见的方法被归纳为几下几类:基于区域的跟踪、主动轮廓跟踪和基于网格的追踪。
对于第一种方法(基于区域跟踪) ,视频对象由用户/物体识别算法来初步确定。 然后采用经典的工具,如小流域改造来对视频序列进行分割。连续帧中的分割区域之间的通信建立并能够跟踪后续帧图像中的视频目标[ 3 ],[ 7 ],[ 13 ] 。
主动轮廓方法通常不运用全局物体的空间和运动信息,而只是依赖视频目标的边界附近的信息[ 2 ],[ 5 ],[ 11 ],[ 12 ],[ 16 ] 。“蛇形浮动”[ 10 ]是一种采用带参量的光滑曲线(运动轮廓)来跟踪视频目标边界的方法。
基于网格的方式[ 1 ], [ 9 ],[ 15 ],[ 18 ]以斜率和运动信息为基础定义了边界上节点和目标内部的初始设置。这些节点设置依据一种和Delaunay三角形类似的三角规律进行合并,产生符合要求的网格。依靠光流估计对节点信息进行采样,跟踪节点设置[ 8 ] 。
一种基于区域跟踪的变形(隶属于基于运动的跟踪),在[ 17 ]中有所介绍 。基于运动的聚类法(运用光流)已经被用于产生连续运动的区域。尽管运动提供了对于视觉图像的有力的描述,但是孤立的基于运动的标准却不能够胜任目标跟踪。 跟踪算法中最主要的问题之一是部分遮挡。对于视频序列中的遮挡检测已经提出来了一些解决方法[ 1 ],[5],[ 14 ] 。迄今为止提出的遮挡检测的方法多集中在解决因为遮挡物体而出现的目标的部分藏匿[ 1 ],[5], [ 14 ] 。在这些著作中,对与遮挡恢复的检测并没有做出最够的重视。
目标跟踪系统的计算量的复杂与否取决于图形分割、光流或是运动估计操作。因此,实际中的实时系统必须避免这些操作的重复。本文提出的算法的主要目的就是在不需要用户交互的情况下长时间持续地预测目标边界。
第二章节给出了所提算法的细节信息。 第三章节论述了该算法在视频序列中用于鉴别遮挡/遮挡恢复。第四节包含实验结果证明了这一方法的有效性。结论和进一步研究已包括在最后一节。
2
北京理工大学本科生毕业设计(论文) 国外文献翻译 Ⅱ 基本跟踪算法
A.一般方法
所提出的算法可以被归类为基于区域的跟踪算法。遮挡和遮挡恢复技术已经被发展成为能够应用在其它的基于区域的技术上以提高跟踪精度。整体算法在(图.1)中进行了概述 。所有的步骤(图.1),在下面几个章节会有解释。在以下章节中, 重新分割是指运用遵循以下提到的用户交互的算法进行的帧图像分割,以重新初始化目标部分。
N0=1 是 是否高速计算帧间( k&k+N0 )的运动均值 在(k&k+N0)帧间进行运动回归估计 用户自定义掩膜(第 k=k0帧) 否 N0=3
图. 1. 跟踪算法. B.目标掩膜的初始化
为了初始化跟踪算法,我们采用基于一种联合算子的分割算法。此联合算子给
3
遮挡及遮挡恢复检测 合并(移除)属于(不属于)目标的区域 计算并更新目标掩膜 k=k+N0 北京理工大学本科生毕业设计(论文) 国外文献翻译
出目标区域信息。[6]提出的分割方法与固定阈值分割比较有更好的效果。 下面给出初始化对象的算法。
1 )用4个波段多值分割法对初始帧进行分割[ 6 ] 。初步分割图由S0标注。 2 )这一步骤的目的是找出目标区域。为了找出这些区域,我们计算在分割图中所有区域的运动矢量。所有运动合理的区域会被标记为一个掩膜中的目标区域。 3 )前一步可能包含属于背景的区域。因此,需要自检测操作以去除一些小的区域。开放空间的处理已应用在形态学后期处理。将掩膜中的孔填充以成为最终掩膜。如果获取的掩膜误差太大,手工进行初始化。
在游鱼序列中按照以上步骤运行的结果在(图.2)中展示 。以上提到的方法对与静态的摄像机取景有很好的效果。目标也可以在图形界面中的手工初始化。如果将要被跟踪的目标类别是知道的,同样可以采用自动初始化。例如,肤色可以用来初始化一个面部跟踪。跟踪算法的效果取决于初始化后的良好的范围。一个完美的初始轮廓是对于一个跟踪算法的最好的输入值。第四章节会分别给出手工初始化和自动初始化的跟踪结果。
图.2 目标初始化:(a)分割图 ,(b)分割图中运动合理的区域
4
北京理工大学本科生毕业设计(论文) 国外文献翻译
图.3 对游鱼图像序列的种子块估计:(a)第75帧 ,(b)第78帧中的运动种子块(黑色---不确定块,白色---目标的运动种子快,灰色---背景的运动种子快)
C.运动估计
运动估计是目标跟踪中的根本要素,因此准确的运动估计是最重要的步骤之一。本文提出的计算块尺寸的方法依据块的位置。改变目标边界的块的大小,此法等价于基于网格的运动估计。因此,运动估计比传统的块匹配技术要更加准确。 1 )块分类:令视频序列的第k帧为I(x,y,k),并且(x,y)表示一个像素点。每一帧都会估计种子运动块。一个种子运动块任意取在目标或者背景中。该算法以一个大小为16×16像素的块开始并且估计反向运动.I(x,y, k+N0)中的每个快与I(x,y,k)中的对应的块相匹配。并且。用一个32×32的窗进行遍历搜索以计算运动矢量。运动估计已经被运用在Y,U,V空间。位于边界的块被标记为不确定的块,它们会在估计步骤的下一环节被处理。(图.)3显示游鱼序列中算得的种子快。。 这些不确定的块会被细分为更小的块(8×8)并且新的种子快会被重估计。搜搜索范围同样会被限定,以保证不会出现错误分类。 这个过程会一直持续到出现一个固定的大小为(8×8)像素的块。
5