基于背景差分法的物体识别(2)

2019-04-22 22:35

第一章前言

本章主要介绍了与论文相关的计算机的发展历程和计算机图像识别和背景差分的发展现状，并列举了一系列的研究成果，论述了本实验的实验目的以及工作条件。

第一节计算机领域的物体识别的发展历史

图像识别，又称计算机图像识别，指通过计算机摄录或存储等途径获得的图片进行处理，分析最终对其进行识别理解的过程。

在工业生产自动化的当代社会，仅仅通过人类对物体进行感官判断来辨别产品或者其他事物显然已经不能满足快节奏运转的世界，在这种大背景下，计算机图像识别技术诞生了，它通过摄像头从外界获取视频形式的数据，再将其变成图片形式数据，和已经输入的或者即时更新的数据作比较，以此来判断目标物体是否符合要求，这一工作模式十分类似于人脑和眼的协调工作模式，因此计算机图像识别这一技术在很多行业迅速得到应用，利用摄像头工作的计算机，甚至机器人等高科技产品不断产生，在一些高危险性，环境恶劣，可活动体积小等不适合人类行动或需长时间工作的特殊环境下发挥了重要作用，大大的降低了特殊职业人群的工作环境和生存率，也加快了行业发展速度。

在这一社会大环境下，越来越多的企业以及个人都着手研发计算机图像识别这一门科学，计算机1946年被发明至今这不到100年时间里，计算机图像识别技术已经获得了很大的进步。

工业自动化以来，每个工厂每天都要出厂数以万计的产品，由自动化流水线制造的产品虽然次品率已经极大降低，但还是存在，用人眼来判断正品次品虽然可行，但是需要耗费大量人力物力，不但降低了生产效率，还为企业浪费大量资金，在企业的需要下，产生了基于图像识别的次品监测装置，该装置只需要少量操作人员，而且操作简单，一般工人经过培训即可使用，既加快了工作效率，也节约了资金，迅速在工业生产、制造业广泛应用。

洪水、地震、火灾乃至核事故造成的辐射等等恶劣环境下往往是人类所不能长期停留甚至不能生存的，一旦遇到这些事故，救援工作往往十分难以展开，救援人员经常束手无策，坐视一个个生命远去。为了改变现状，科学家研制出一种救灾机器人，它能在这些环境下以人操作，和自主探测方式进行救灾活动，提高了救援速度，也提高了救援人员的生还率，立即成为世界机器人研究界的研究热点。

在当今社会反恐环境日益严峻的情况下，相应的武器装备的改变也在悄然发生，二战以来的大威力，大杀伤力进程火炮逐渐失去了原来的地位，取而代

之的是火力适当，附带伤害小的精确战术武器——电视制导导弹，图像制导导弹，这种武器快速精确，能够有效打击武装分子并把平民伤害降到最低，符合当今世界人道主义的主题，逐渐受到各国的青睐。

人脸识别是现今最热门的研究方向之一，在磁卡解锁的锁闭方式安全性以及稳定性不能得到保证的情况下，愈来愈多的对安全性要求过高的机构采取了人脸识别或虹膜识别模式，虽然价格昂贵，仪器体积庞大，具有科研能力的单位较少，但这种方式具有可靠性高，使用方便等优势。

迄今为止，图像识别领域已经取得了极大的进步，但随着科技的发展，它随时都有可能获得更大的进步。

第二节计算机图像获取技术现状及前途

自1973年面世以来，摄像机一直是人类记录动态物体的唯一方法，在计算机上应用的图像获取装置也只有摄像头，所以摄像头的发展极大地影响了图像获取技术的发展。

40多年前美国安培公司推出世界第一台可以投入实际使用的摄像机。这种摄像机采用摄像管作为摄像元件，因此寿命低，性能不稳定而且价格高昂等缺陷限制了摄像机的普及，一直到摄像机的下一次革命，这种高贵的产品一直只能用于特定领域，无法民用化。

1976年，摄像机技术迎来了一次革命性的飞跃。JVC公司推出第一台家用摄像机，使用的是VHS格式（Video Home System，家用摄像系统），VHS采用12.65毫米盒带，极大地降低了摄像机价格，简便了其操作，使其在推出之后广受大众喜爱，迅速在民用市场上普及，将摄像这一技术带入人们观念。

在市场的推动下，VHS很快暴露出了其弱点——清晰度低，仅仅有250线的清晰度广为使用者诟病，为弥补这一不足，JVC公司很快研制出一种S—VHS摄影机，这种摄像机可以拍摄高达400线的视频，满足了大众需求。

然而VHS与S—VHS庞大的体积却让它在流通的时候遇到了巨大的阻力，因此，1982年，VHS-C和S-VHS-C两个型号的摄像机应运而生。这两种摄像机的机能与前两种相差无几，均使用同样宽度的磁带，可以通过适配器连接到录像机上观看，但92mm X 69mm X 23mm的轻便体积让其在对前者的竞争中占尽优势，称为社会主流，摄像机也由这股风潮进入我国。

VHS-C和S-VHS-C的成功并没有终结摄像机轻便小体积化的脚步，反而加速了其进程，继JVC公司之后，索尼（SONY），夏普（Sharp），佳能（Canon）也推出了自己的小型摄像机——8mm摄像机，通称V8。这种摄像机采用8mm磁带，体积的缩小给摄像机带来的负面效果就是拍摄清晰度降低为270线，而且这种摄像机拍摄的磁带不能再用VHS录像机播放，只能用摄像机播放。

V8面世不久，索尼公司又独自推出了一款家用摄像机——Hi8，同样使用8mm磁带的Hi8结构更加精密，摄像清晰度达400线，将家用摄像机性能推至又一高水平。

随着时代发展，VHS、S—VHS、VHS-C、S-VHS-C、V8和Hi8都不能满足用户需求，于是，DV应运而生。

DV，全称digital video camrecoder（数码摄像机），以小体积的Mini DV为存储介质，分辨率可达500线远高于前面任何一种摄像机的清晰度的低于400的清晰度。DV拥有超高频宽的亮度和色彩度，是普通摄像机的六倍，纯正的色彩士气基本达到专业级水平，它基本可以无限翻录不损失画质，使用ieee 1394数码输出端子，使数据传输简单可靠，基本无损。以上的优势让DV在出现不久就迅速占据市场。

2003年，索尼，夏普，佳能，JVC公司联合推出了HDV格式，目的是为了开发一种能录制具有更高清晰度和高质量的家用便携摄像机。这种摄像机的诞生使得电视的清晰度第一次超越了胶片拍摄的电影。达到720线逐行扫描或1080线隔行扫描的清晰度。

由于DV格式的深入人心和HDV刚刚出现不久，2005年前，数码摄像机的主要存储介质还基本都是Mini DV，它的记录时间一般为60分钟，部分摄像机具有LP功能，可以将记录时间延长到90分钟，而不损失画质，由于其高画质小体积，令其在专业摄影界也拥有了一席之地，如松下的DVCPRO和索尼的DVCAM等都是著名的专业摄影机，他们为了满足专业人士需要，将录像时间长度调整为180分钟，依然采用Mini DV作为主要存储介质。

表2.1 HDV和DV的比较

存储介质视频信号像素宽高比压缩（视频）亮度抽样频率抽样格式量化值 HDV（1080i） DV磁带 1080/60i及 1080/50i 1400×1080 16:9 55.6875 MHz HDV（720i） 720/25p 720/30p 1280/720 DV 720/50p(PAL) 720/60p(NTSC) 720×576 (PAL) 720×480(NTSC) 4:3（16:9） MPEG-2视频（框架和级别，MP@H-14） DV 74.25 MHz 4:2:0 8比特 19 Mbps 3

25 Mbps MPEG-1音频层II 13.5MHz 4:2:0（PAL）4：1：1(NTSC) 压缩后比特率（视频） 25 Mbps 压缩（音频）

抽样频率量化值 48 kHz 16比特 48kHz/44.1kHz（2声道模式）32kHz（4声道模式） 16比特（2声道模式）/12比特非线性（4声道模式） 1.5Mbps 立体声（2声道）/立体声×2（4声道） -- 传输流 -- IEEE1394（DV）压缩后比特率（音频） 384kbps 音频模式数据格式流类型流接口立体声（2声道） MPEG-2系统打包基本流 IEEE1394（MPEG-2-TS）随着时代的发展，各国又推出了高清这一模式，使清晰度达到16:9比例下的1280*720,1920*1080。当然每个公司都有着自己的特有清晰度，使得市场上的视频产品规格不一，不过随着产业升级，各个不同的规格一定会统一成更好的规格。

第三节计算机图像识别技术现状及前途

计算机图像识别这门学科在当今人工智能领域中已经占据了相当大的空间，为了能更加精确的模拟人类智能，图像识别必不可少，为此人们提出多种图像识别模型，如模板匹配模型。模板匹配模型，又叫模板，是一种对比识别的识别模式，即，计算机如果想识别一个图像，负责识别的存储空间内必须有与其相对应的模板，如果有，则可识别，没有，则无法识别。例如，电脑要识别B这个字母，就要首先在脑内寻找与B这个图形大小、方位和形状都匹配的的模板，如果找到了，就可以完成识别，确认这个字母是B。这种方法非常简单，但是这只是一种十分理想化的识别方法，现实世界中的，物体的物力外形虽然不会经常变化，但随着视角，光线和外力的影响，物体的视觉外形是经常变化的，把所有的可能性全部做成模板显然过于复杂，不能实际应用。而且单单从字母识别这个问题上看，如果模板里的字母B是印刷体，而被测物体是手写体，也会造成识别不成功，所以模板法并不可行。

格式塔心理学在模板法识别图像这一研究上也提出了具有格式塔心理学特征的原型匹配模型。这种模型强调人类识别某个物体并不是基于长时间大量记忆某个物体的全部形态，而是通过相似性来识别，这种相似性是从记忆的模板中提取出来，用以衡量当时视线里看到的物体的一种原型，当看到一个图像时，搜索脑内，寻找拥有相似特性的模板，如果有相似的模板在，那么成功识别，否则无法识别，计算机不认识这个物体。它也很好的说明了人类对不规则物体的识别。但是这种模板有一个缺憾，就是没有说明人类如何获得这种相似性，

没有编程依据，也就无法在计算机上实现。随即，又有新的模型，这种模型更加复杂，它就是“泛魔”识别模型。“泛魔”识别模型图像识别系统，基于特征分析，1959年由B.塞尔弗里吉提出，这种识别模型第一次把特征觉察原理应用与图像识别。“泛魔”识别模型把图像识别分为多个不同的层次，每个层次各司其职，各自进行不同的特征识别机制，一步一步识别，最终把每部分的结果合成起来，作为最终识别。每一种特征识别层被它的发明者塞尔弗里吉戏称为\小魔鬼\，许多这样的层合在一起，形成了所谓的“泛魔”识别模型。“泛魔”识别模型解决了相似图像识别、失真图像识别、比例放缩图像识别等难题。它可以进行学习，而且是每一层的“认知鬼”进行单独学习，这让“泛魔”识别模型具有很强的灵活性，可以随着使用者的需要进行升级。如字母识别，每个认知鬼可以逐渐学会一个字母的某一方面特征，如大小、形状，颜色等等，很多很多认知鬼合起来就可以进行一次完整的识别。现在“泛魔”识别模型已经被用于人的识别工作。

第四节色彩标准分类

RGB色彩模式是工业界的一种颜色标准，通过红绿蓝这三种基础颜色的不同比例搭配几乎可以获得自然界中所有颜色，而且非常符合人类对颜色的感知。RGB即是代表红（Red）、绿（Green）、蓝（Blue）三个通道的颜色，因为这个标准几乎包括了人类视力所能感知的所有颜色，而且简单易懂，所以是目前运用最广的颜色系统之一，而且衍生出各种子标准，如RGB1、RGB4、RGB8、RGB555，广泛已用于各个领域。

CIE L*a*b*：由于同时使用过多无法被统一的色彩标准，导致了诸多生产设计上的不便，所以国际标准色彩协会（International Color Consortium）于1931年专门制订了一套国际通用的色彩表示标准以解决该问题。这套色彩系统与印刷设备与器材都没有任何关系。L*a*b由一个垂直轴心表示明亮度（Luminance）的全白到全黑，两个水平延伸面表示色彩，其中之一为红到绿色，另外一个面表示蓝到黄色。

CMYK：又叫印刷色彩模式，这种色彩模式依靠反光，与RGB十分相似，只是CMYK用的颜色不是红绿蓝，而是印刷油墨的颜色：青色Cyan、品红色Magenta、黄色Yellow。而K是黑色Black的尾字母，之所以不取首字母，是为了避免与蓝色(Blue)混淆。理论上来讲，只需要CMY三种油墨混合就能得到黑色，可是CMYK是一种用于印刷这一实际行为，而非频幕显示，以当前的生产水平不能生产出纯色油墨，所以青色品红色和黄色这三种油墨混合只能得到暗红色，为了符合实际要求，才加上纯黑色这一个基础颜色。

共7页:

基于背景差分法的物体识别(2).doc 将本文的Word文档下载到电脑下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档