学士学位论文
表 1 图像信息与信道带宽
图像信号 高品质电视HDTV 一般HDTV 广播电视演播室 广播电视节目播送 有线电视、光盘 双向电视会议 可视电话
信道带宽 140 Mb/s 60~140 Mb/s 30~45 Mb/s 20~30 Mb/s 1.5~20 Mb/s 384 Kb/s~2 Mb/s 9.6~64 Kb/s
原码率 1.2 Gb/s 600 Mb/s 216 Mb/s 216 Mb/s 50~100 Mb/s 50~100 Mb/s 10~20 Mb/s
显然地,电视信号数字化后,其数据保存的容量的传输的带宽是难以令人接受的,因此必须对数字图像数据进行压缩。
1.2 DCT的研究目的和意义
现今社会,每天都有大量的信息用数字进行存储、处理和传送。这些每日往来的信息给我们带来了便利和安逸。因为网上的许多信息是以图像形式存储的,所以对于存储和通信的需求是无限的。而数据压缩方法比起数据的存储和/或传输具有更为突出的实用价值和商业意义。
在信息世界迅猛发展的今天,人们对计算机实时处理图像信息的要求越来越高。如何在保证图像质量的前提下,同时兼顾实时性和高效性成了一个值得关注的问题。对图像进行一定的压缩处理成为了一个不可或缺的环节。
图像压缩所解决的问题是尽量减少表示数字图像时需要的数据量。减少数据量的基本原理是除去其中多余的数据。以数学的观点来看,这一过程实际上就是将二维像素阵列变换为一个在统计上无关联的数据集合。这种变换在图像存储或传输之前进行。在以后的某个时候,再对压缩图像进行解压缩来重构原图像或原图像的近似图像。
当前,图像压缩被认为是一种“开放技术”。由于现代图像传感器不断提高空间分辨率以及电视广播标准的不断发展,图像压缩也成为一种基本技术。再有,数据压缩在许多重要且性质不同的应用领域中扮演着主要角色,比如,电视会议、遥感(使用卫星成像进行天气预报和其他地球和其他地球资源应用)、记录文献和医疗成像、传真(FAX)、军事上的远程遥控车辆驾驶、空间中的及危险废弃物管理等方面。
图像压缩比较常用的变换有离散傅里叶变换(DFT)、Walsh-Hadamard变换(WHT,及小波变换)、离散余弦变换(DCT)和Karhunen-Loève变换(KLT)。图像压缩中最常用到的一种变换是离散余弦变换。DCT的信息压缩能力比DFT和WHT的能力要强。尽管大多数自然图像通常都有这样的条件,但在数据压缩方面最佳的变换方法是KLT而不是DCT。KLT对任何输入图像和以任何数量保留下来的系数,都可以将均方误差降至最低。然而,由于KLT具有数据依赖性,所以通常得到每幅子图的KLT基础图像所需的计算任务繁重。由于这个原因,KLT很少在实际的图像压缩中应用。反而像DFT,
2
学士学位论文
WHT或DCT这样的具有固定(有输入独立性)基础图像的变换方法的使用较为常见。对可能输入的独立变换,非正弦变换(如WHT变换)是最容易实现的。而正弦变换(如DFT或DCT)的信息压缩能力更接近最佳KLT变换方法的能力。
因此,许多变换编码系统都是以DCT变换为基础的,这种变换方法在信息压缩能力和计算复杂性之间提供了一种很的平衡。实际上,DCT的性质已经提供了作为一种变换编码系统的国际标准所具有的实际价值。对比其他输入独立的变换方法,DCT变换具有使用单一的集成电路就可以实现,可以将最多的信息包装在最少的系数之中,以及能使被称为“分块噪声”的块效应最小等优点。
本文选择离散余弦变换(DCT)作为图像压缩的压缩方法进行分析研究具有理论价值和现实意义。
1.3 DCT的发展现状
1974年由Ahmed和Rao提出的离散余弦变换,至今已有30多年历史。最初在这一领域研究的焦点集中在建立一种模拟的方法以便减少视频传输所需的带宽。这一过程称为带宽压缩。数字式计算机的出现和后来先进的集成电路的发展,导致了这方面研究的重点从模拟方式转移到数字压缩方法上来。随着最近几种关键性的国际图像压缩标准的正式采用,这一领域在理论研究的实际应用方面有了重大的发展,这是自20世纪40年代C.E.Shannon和其他人首先提出信息的概率观点与信息的表达,传输和压缩以来又一重要的发展阶段。
此间,DCT编码已发展成为JPEG、MPEG、H.26x等图像/视频编码标准中的核心。尽管Shapiro的EZW以及Said等人的SPIHT小波编码的成功应用,对传统的DCT编码提出了挑战,但Xiong等人利用嵌入式DCT块变换之间的直流相关性,以及对DCT后的系数进行策略性重组或层式DCT同样具有小波多分辨率图像的分解特性。此外,基于层次嵌入式DCT、形状自适应DCT、截短DCT、感兴趣区域支撑DCT以及形态DCT等改进形式的编码,都是将基于DCT变换编码推向更高层次。就DCT改进的变换,以及DCT系数的应用,如利用DCT系数实现信息隐藏等,也使得基于常规的DCT变换编码有了更广阔的应用与发展空间,文章就此作了广泛的比较和深入的研究,并指出了发展方向。
因此,要对图像进行压缩,选用DCT而不用DFT。
3
学士学位论文
2 图像压缩的基本原理
图像压缩的目的在于用最少的数据量来表示尽可能多的原图像的信息。对于图像而言,如果需要进行快速或实时传输以及大量存储,就需要对图像进行数据压缩。在同等的信息容量下,若将图像数据压缩之后再传输,就可以传输更多的图像信息,就可以增加通信的能力。
2.1 图像压缩的基本思想
图像压缩的基本思想就是要想办法除去图像中数据之间存在的相关性。所谓相关性,就是能够根据给出的一部分数据来判断出其相邻的数据。图像压缩就是把图像数据中能根据其他数据推算得到的数据去掉。
现在的图像压缩技术一般基于以下两点:
(1)图像信息存在很大的冗余度,数据之间存在着相关性,如相邻像素之间色彩基本相同。
(2)人的视觉对于边缘急剧变化不敏感,人眼具有对图像的高度敏感性高、对色彩敏感性低的特点。
图像压缩主要就是根据这两点特征进行的,由此发展出图像压缩的两类基本方法:无损压缩和有损压缩。无损压缩是将相同的或相似的数据或数据特征归类,使用较少的数据量描述原始数据,达到减少数据量的目的;有损压缩是利用人眼的视觉特性有针对性地简化不重要的数据,以减少总的数据量。其中,有损压缩只要损失的数据不太影响人眼主观接收的效果,就可以采用。
图像的主要参数之一是图像压缩比,定义为压缩后的图像数据量与压缩前的图像数据量之比:
图像数据压缩比=压缩后的图像数据量
压缩前的图像数据量显然,压缩比越小,压缩后的图像文件数据量越小,图像质量有可能损失越多。但压缩比并不是一个绝对 的指标,压缩的效果还与压缩前的图像效果及压缩的方法有关。
图像数据总是存在各种信息的冗余,如空间冗余、信息冗余、视觉冗余和结构冗余等。压缩就是去掉各种冗余,保留有用的信息。图像压缩的过程通常称为编码,在信息论中属信源编码,图像恢复的过程通常称为解码。
2.2 图像压缩的基本原理模型
一般的图像压缩系统模型如图 2.1所示。
4
学士学位论文
信源f?x,y? 信源信道信 编码 道 编码 编码器 信道信源 解码 解码 解码器 用户f?x,y? ?图 2.1 一般图像压缩系统模型
一个图像压缩系统包括两个不同的结构块:一个编码器和一个解码器。信源图像
f?x,y?输入到编码器中。这个编码器可以根据输入数据生成一组符号。在通过信道进行传输之后,将经过编码的表达符号送入解码器,经过重构后,就生成了输出图像
??f?x,y?。一般来讲,f?x,y?可能是也可能不是原图像f?x,y?的准确复制品。如果输出
图像是输入的准确复制,系统就是无误差的或具有信息保持编码的系统;如果不是,则在重建图像中就会呈现某种程度的失真。
图 2.1中显示的编码器和解码器都包含两个彼此相关的函数或子块。
编码器由一个信源编码器和一个信道编码器构成。其中,通过信源编码解决有效性问题,也就是对信源实现压缩处理,使处理后的信号更适合数字通信系统,解决有效性问题就是在编码过程中尽量提高编码效率,也就是力求用最少的数码传递最大的信息量,这实质上是压缩频带的问题。通过信道编码解决可靠性问题,它用于增强信源编码器输出的噪声抗扰性,也就是尽量使处理过的信息在传输中不出错或少出错。
与之相应地,一个解码器包括一个信道解码器和一个信源解码器。如果编码器和解码器之间的停产是无噪声的或趋向于无误差,刚信道编码器和信道解码器可以略去,而一般的编码器和解码器分别是信源编码器和信源解码器。
2.2.1 信源编码器和信源解码器
信源编码器的任务是减少或消除输入图像中的编码冗余、像素冗余或心理视觉冗余。特定的应用和与之相联系的保真度要求规定了在给定情况下使用的最佳编码方法。通常,这种方法可以通过一系列三种独立的操作建立模型。如图 2.2(a)所示,每种操作被设计用于减少上述三种冗余中的一种。图 2.2(b)描述了对应的信源解码器。
f?x,y?转换器 量化器 (a)信源编码器 符号编码器 ?信道 信道 符号解码器 反向转换器 f?x,y?(b)信源解码器 图 2.2 (a)信源编码器和(b)信源解码器
在信源编码处理的第一阶段,转换器将输入数据转换为可以减少输入图像中像素间
5
学士学位论文
冗余的格式,这种格式通常不可见。这步操作通常是可逆的并且有可能直接减少表示图像的数据量。转换程序将图像变换为一个系数阵列。这样做使编码处理的后续阶段中更容易找到像素间冗余以便压缩。
在第二阶段中,或图 2.2(a)中的量化器模块中,将转换程序的输出精度调整到与预设的保真度准则一致。因此,当希望进行无误差压缩时,这一步必须略去。
在第三个阶段,即信源编码处理的最后阶段,符号编码器生成一个固定的或可变长编码用于表示量化器输出并将输出转换为与编码相一致。“符号编码器”与整个信源编码处理过程不同,在大多情况下变称编码用于表示经过转换和量化的数据集合。它用最短的码字表示出现频率最高的输出值,以此减少编码冗余。此操作是可逆的。在符号编码的完成阶段,输入图像经过处理已经消除了上述的三种冗余。
图 2.2(a)显示了信源编码处理三个相继的操作,但并不是每个图像压缩系统都必须包含这三种操作。而且,某些图像压缩技术是将图 2.2(a)中物理分开的某些模块进行合并后建立的模型,即转换器和量化器经常用一个模块表示,该模块同时执行这两部分的操作。
图 2.2(b)中显示的信源解码器仅包含两部分:一个符号解码器和一个反向转换器。这些模块的运行次序与编码器的符号编码器和转换模块的操作次序相反。因为量化过程导致了不可逆的信息损失,反向量化器模块不包含图 2.2(b)所示的通常的信源解码器模型中。
2.2.2 信道编码器和解码器
当图 2.2中显示的信道无噪声或趋向于无误差时,则图像压缩系统中就算没有信道编码器和解码器,最后的结果也不会受到太大的影响。而现实当中这种情况几乎不存在,也就是说信道带有噪声或易于出现错误时,信道编码器和解码器就在整个译码解码处理中扮演了重要的角色。
信道编码器和解码器通过向信源编码数据中插入预制的冗余数据来减少信道噪声的影响。由于信源编码器几乎不包含冗余,所以如果没有附加这种“预制的冗余”,它对噪声传送会有很高的敏感性。
6