现代信息检索课程报告——《基于内容的视频信息检索》
4. 3 视频检索的实现
在实现了视频片断被分割成独立的镜头以后,只是完成了对视频片断的初步加工。我们还无法对镜头和关键帧进行检索,原因是还没有为之设置一个匹配的标准,这个时候需要我们提取视频片断的特征值并将特征值按标准进行描述,之后我们才能实现对视频的检索。
4. 3. 1 提取特征值
镜头是视频检索的最小单位。视频分割成镜头后, 就要对各个镜头进行特征提取,得到一个尽可能充分反映镜头内容的特征空间, 这个特征空间将作为视频聚类和检索的依据。
视频数据的特征分为静态特征和动态特征
静态特征提取
静态特征的提取主要针对关键帧, 可以采用通常的图像特征提取方法, 如提
取颜色特征、纹理特征、形状和边缘特征等。由于数字图像处理的知识由于不
是本文的重点所以不做阐述。
运动特征提取
视频数据的运动特征,主要反映视频数据的时域变化,而且往往是用户检索时
所能给出的主要内容,例如用户可能要求检索有变焦的视频片段,或者在监控
系统中检索某个对象从画面上消失的关键帧。因而对视频数据进行特征提取必
须研究其运动特征。由于运动特征无法从一幅静止图像中获得,故必须对视频
序列进行分析。运动分析的方法有X 线断层分析,它把一个镜头的视频序列看
成一个整体,通过对这个序列沿时间轴进行切片,从而得到x- t 切片图像和
y- t 切片图像。然后分析切片图像,即可以得到镜头的运动情况。
5 存在的问题及应用前景
基于内容的视频检索系统能够使用户通过自己输入的视频特征来实现快速有效地浏览和播放视频文件,所以基于内容的视频检索系统有着极其巨大而且美好的应用前景。
当前也存在着一些问题急需解决:
(1)面向查询检索的特征提取与匹配[11]
目前,基于特征检索的视觉信息提取受限于多媒体对象的底层特征:如图像的颜色、形