多媒体数据压缩(3)

2020-02-20 23:12

v?0,1,2,...,N?1

2 f(x,y)?MNM?1N?1u?0v?0??K(u)F(u,v)cos2[x(

[y(?)v?/2N] (3-28b) ?1)u?/2M]?cos2.,?1 x?0,1,2,..M.,?1 y?0,1,2,..N其中

?1/2,u?0 K(u)??

u?1,2,?,M?11,?

K(v)???1/2,v?0 (3-29)

v?1,2,?,M?1?1, 如同二维傅里叶变换一样,二维离散余弦变换也是行列可分的,因此,可以把

二维离散余弦变换变成首先在行的方向对原始图象进行一维离散余弦变换,然后再在列的方向进行一维离散余弦变换。

另外,从离散余弦变换的正变换和逆变换的公式上可以看出,正变换和逆变的变换核函数是一样的,这一特点给计算机编程和研究快速算法带来很大方便。

3.4.3 二维离散余弦变换的快速算法

实现快速二维离散余弦变换有三种方法:第一种方法是上面介绍的采用傅里叶变换法,即把原始图象构造成偶对称阵列,然后采用快速傅里叶变换;第二方法是把二维变换分解成在行和列方向的二次一维变换;第三种方法是根据二维变换公式,研究二维离散余弦变换的快速算法。这种快速算法,只要把原始图象进行分块、排列、组合,就可以把复杂的余弦函数的乘法、加法运算变成只需进行实数乘法和加法的运算,从而大大地提高了运算速度。

3.4.4 基于离散余弦变换的编码压缩方法

图3.6示出基于离散余弦变换DCT的编码过程框图

311

量化阵偏移量数据DCT差分编码DC687-2-20-300220020-1-1-11111010110101110000110110001100100100100Z字形 扫描编码AC÷10量化器可变长编码(Huffman)码流000800880884884468-23-4-3-23-28173-41720-11-33-11-12-23-23-4-28-4-31717-33203-11-11-12DC系数AC系数Huffman码表符号0-1-2+2-3+1+7码字01001011101110011101111100070-20-200-3000202000200-10-10-10200900780784984370-200-20-2320002020-100-10-10Z字形扫描解码量化阵×10反量化器可变长解码恢复数据IDCT差分解码

图3.6 基于DCT的编码过程框图

对于变换编码压缩方法,首先需要把原始图象分块,对于DCT变换编码压缩方法,通常把原始图象分成8×8大小的子块,每一子块顺序地进行DCT正变换,对DCT变换系数,进行量化,然后进行编码。

基于DCT的解码过程与编码过程相反,即首先解码,然后去量化,对每一子块进行DCT反变换,得到子块图象,各个子块顺序进行,便得到了解码后恢复的图象。

上述基于DCT的编码解码过程中所用的量化及编码器及解码器,我们在本章的后面几节将加以介绍。

上面几节介绍的熵编码、预测编码和变换编码等编码压缩方法可以混合使用,形成混合编码方法。因此,混合编码方法是指对一幅图象同时使用两种或两种以上的编码方法混合起来进行编码的方法,以达到高效压缩数据的目的。例如,通常采用预测编码与变换编码的混合编码方法。这种混合编码,既具有预测编码实现简单的优点,又具有变换编码的抗误差能力强的优点。

对于电视图象可以有帧内混合编码和帧间混合编码两种情况。帧内混合编码,

312

可首先对图象沿行方向作一维正交变换,然后对变换后的系数在列方向进行预测编码。另外一种情况是在图象二维空间中进行分块正交变换,然后对其变换作帧间预测编码;或者对帧间块作预测,然后对预测误差再作正交变换、量化、编码等。 总之,混合编码具有计算量适度,抗干扰能力强,并能得到较大的压缩比等优点。在下面几节介绍的用于多媒体中的三个标准编码压缩方法,都采用混合编码方法。它们采用离散余弦变换、行程编码、预测编码以及基于统计特性的熵编码的混合。这种混合编码方法可以得到很高的压缩比和令人满意的图象主观保真度质量。

3.5 静止图象的压缩标准JPEG

JPEG专家组经过 5年的细致工作后,于 1991年3月提出了ISOCD 10918号建议草案:“多灰度静止图象的数字压缩编码”, 即通称的JPEG标准。主要内容如下:(1) 基本系统(Basic System)提供顺序扫描重建的图象,实现信息有丢失的图象压缩,而重建图象的质量要达到难以观察出图象损伤的要求。它采用8×8象素自适应DCT算法、量化及哈夫曼(Huffman)型的熵编码器。(2) 扩展系统(Extended System) 选用累进工作方式,编码过程采用具有自适应能力的算术编码。(3) 无失真的预测编码,采用帧内预测编码及哈夫曼编码(或算术编码),可保证重建图象数据与原始图象数据完全相同(即均方误差等于零)。

3.5.1 基于DCT的编码器和解码器方框图

基于DCT的编码器和解码器方框图如图3.7所示。

8x8方块正向DCT熵编码器量化器压缩图象数据源图象数据量化表(a) 编码器基于DCT的解码器熵码表压缩图象数据熵解码器去量化器反向DCT重建图象数据熵码表量化表(b) 解码器

图3.7 基于DCT的编码器和解码器方框图

原图象数据首先经过分块,即分成8×8象素方块,每块数据依次送入编码器,

313

每块数据送入编码器后,首先进入DCT变换器,然后把变换系数经量化器量化,量化器所需的量化表数据由图中量化表部分提供。量化后的数据送入熵编码器进行熵编码,熵编码所需的熵编码表由图中熵码表部分提供,经熵编码后的图象压缩数据可以存入缓冲器中,也可直接发送。由此可见JPEG标准的编码压缩主要在DCT系数的量化和熵编码二部分实现。JPEG的解码过程与编码过程相反,即压缩的图象数据首先进行熵解码、反量化、和余弦逆变换IDCT。编码器中熵编码和量化过程实质上是一个查表过程;而解码器中的熵解码和反量化的过程实质是反查表过程,因此量化表和熵码表在编码器和解码器存有相同表格。

图3.7表示的只是一个单分量(例如图象的灰度信号)图象的压缩编码及解码过程,对于实际的彩色图象及更详细的编码器及解码器框图如图3.8所示。

复合视频信号NTSCPALSECAM解码器方框1RGB模数A/D转换器方框2RGBJPEG的亮度和色度信号YCrCb方框3Y最小离散余弦Cr编码单元MCU变化MCUDCTCb方框4方框5DCT系数量化器方框6之字形扫描方框7基于DCT的编码器复合视频信号NTSC,PAL,SECAM熵编码器方框8数据交换格式方框9熵解码器去量化器反向离散余弦变换IDCT由Y,Cr,Cb计算R,G,B数据转换器NTSCPALSECAM编码器基于DCT的解码器图3.8 编码器与解码器

3.5.2 图3.8中各部分的进一步说明

1. NTSC、PAL、SECAM解码器

图3.8中NTSC、PAL、SECAM解码器的作用是把上述三种电视图象制式的图象转换R、G、B三基色图象。其详细框图如图3.9所示。

314

NTSC解码器复合视频信号开关1RGBRGBRGBRGPAL解码器B开关2SECAM解码器检测器图3.9 NTSC、PAL、SECAM解码器

图中NTSC、PAL、SECAM解码器是把上述三种制式的复合视频信号分解成一个亮度信号和二个色度信号,再经过矩阵电路转换成R、G、B三种基色信号。图3.9中检测器可以识别电视制式,从而控制开关1 和开关2 接通到相应制式的解码器上。

2. A/D转换器

图3.8中A/D转换器的作用是把R、G、B三幅基色模拟图象转换成数字图象,即需要经过取样和量化两个步骤。

通常一帧模拟图象是由从左到右,从上到下的扫描行构成的。当前扫描方式有两种,一种是广播电视中常用的隔行扫描。另一种是计算机监视器常用的顺序扫描,不管那一种扫描方式,都可以对扫描行中的电视视频信号取样,从而得到各象素的电压数据。

视频信号的取样与视频信号的最高频率有关。根据奎奈斯特定律,取样频率应大于或等于2倍最高视频信号的频率。以NTSC制为例,它的视频最高频率为4.2MHz,故样频率可选取8.4MHz 至9MHz。NTSC制的行频 fH?59.94场/秒?525行/场?15734.25行/场 2所以行周期tH?1/fH?63.5556?s,每行的显示时间td?0.835tH?53.069?s。如图3.10所示。

视频信号色同步td行同步显示区tH

315


多媒体数据压缩(3).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:噶米新编实验五 机械运动创新设计方案拼装

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: