多媒体数据压缩(4)

2020-02-20 23:12

图3.10 电视信号的扫描行

若取样频率fs 等于 9.045MHz，则 td 时间内的取样数N为 N?fs?td?9.045MHz?53.06?9s?48 0这就是A/D转换器中每行采样的象素数目。

在JPEG标准中，通常一个采样值用8位量化，即量化成28 =256个灰度等级。一个象素还有形状，称为纵横比，按JPEG标准规定象素纵横比为1:1，也就是说象素是方格子。例如上述 NTSC制中一行象素为480个，电视图象尺寸的纵横比为3:4，则一帧图象应有的行数为480×3/4=360行。现在NTSC制一帧图象为525行，一帧包含两场，若扣除两场的场消隐所需的74行(也可以少扣除一些行)则余451行。要把451行转换到360行，则需要并行, 约每10行需要并成8行，这就是图象光栅处理中常用的光栅转换成扫描转换。

3. 亮度和色度转换

图3.8中亮度和色度转换部分是将R、G、B三基色信号，转换成JPEG标准的亮度和色度信号。

一幅彩色图象信号可以由R、G、B三基色图象相加而成。同样一幅彩色图象也可由一幅黑白图象加上彩色图象而成。这就是说可以把R、G、B三基色转换成亮度信号Y和色度信号U、V。由于人眼对图象的亮度敏感，而对图象的色度不敏感，所以在传输亮度信号时要保证其清晰；而在传输色度信号时可以降低清晰度。利用人眼的这种特性(心理视觉冗余度)，在传输彩色视频信号时可以对色度信号进行更多的压缩，从而达到整体图象数据压缩更多的目的。

在模拟彩色电视中，亮度信号与经过载波调制的色度信号叠加后传输，可以达到彩色电视与黑白电视兼容的目的，即黑白电视机收到这种信号后，只有其中的亮度信号能显示，色度信号不显示。现存三种模拟彩色电视制式NTSC、PAL、SECAM均有这种兼容作用。这三种制式和JPEG标准的亮度信号和色度信号计算公式如表3.1所示。表中Y为亮度信号,U、V、I、Q、Dr 、Db 、Cr 、Cb 均为不同制式中的色度信号。当拍摄黑色图象时，R=G=B=Y，于是所有的色差信号(R-Y), (B-Y)皆为零，即所有的色度信号都为零。另外，各种制式中均有建立上述公式所必须的基准白。在表3.1中共有两种基准白，其一为C白，即白昼日光平均而得；其二是D6500 白，它是绝对黑体在绝对温度为6500K时的白色，它和C白很相似，但更确切地反映白昼光。

JPEG标准中的色度信号Cr 和 Cb 经常有正有负，为此各加0.5，称为零移，或称黑电平移动。另外在Cr 和 Cb 表达式中各有系数1/16 和1/2，这些措施共同保证色度信号Cr 和 Cb 的数值经常保持在0 和1之间，由于A/D变换中的量化为8bit，即0和255之间的整数，因而亮度、色度变换输出的Y、Cr 、Cb 也取位于0 至255之间的整数。在实际应用中，通常在DCT变换前，把Y、Cr 、Cb 减去均值128，使其具有正负对称状态，这样可以降低传输时的码速率。

表3.1 亮度和色度信号的计算公式表

316

PAL制基准白:D6500YUV= 0.299 0.587 0.114 -0.147 -0.289 0.463 0.615 -0.515 -0.100RGBY=0.299R+0.587G+0.114BU=0.483(B-Y)V=0.877(R-Y)NTSC制基准白:CYIQ= 0.299 0.587 0.114 0.596 -0.274 - 0.322 0.211 -0.522 0.311RGBY=0.299R+0.587G+0.114BI=VCos33o - USin33oQ=VSin33o + UCos33oSECAM制基准白:D6500YDrDb= 0.299 0.587 0.114 -0.133 1.116 0.217 -0.450 -0.883 1.333RGBY=0.299R+0.587G+0.114BDr=-1.902(R-Y)Db=1.505(B-Y)JPEG制基准白:CYCr-0.5Cb-0.5= 0.3 0.6 0.1 0.4315 -0.375 -0.06250.15 -0.30 0.45RGBY=0.3R+0.6G+0.1BCr=1/1.6(R-Y)+0.5Cb=1/2(B-Y)+0.5

4. 最小编码单元MCU

图3.8中最小编码单元MCU是为后继DCT作准备。按JPEG标准，源图象以帧为单位，每帧图象最多由4个分量图象组成，分量图象用符号Ci表示, i?1,2,3,4。例如一帧彩色图象由三个分量图象组成，C1?Y,C2?Cr,C3?Cb。由于人眼对色度不敏感，所以色度分量C2和C3的象素可以减少。

若在一帧图象的各分量图象中，最大水平方向象素数为X，最大垂直方向象素数为Y，则第i个分量的象素数Ci由取样因子Hi(水平方向)和Vi(垂直方向)按下式决定

Xi?(xHiV), Yi?(yi) （3-30） HmaxVmax式中Xi和Yi为Ci的水平和垂直方向的象素数。Hmax和Vmax为帧内分量最大的水平和垂直方向的取样因子。

例如，某彩色图象的三个分量图象中，最大水平方向象素数为640，最大垂直方向象素数为480，已知三个分量的取样因子如下所示。

C1?Y,H1?2,V1?2 C2?Cr,H2?1,V2?1

C3?Cb,H3?1,V3?1则最大取样因子Hmax = 2, Vmax = 2，因此各分量的象素计算如下

317

C1?Y,X1?640?2/2?640,Y1?480?2/2?480C2?Cr,X2?640?1/2?320,Y2?480?1/2?240 C3?Cb,X3?640?1/2?320,Y3?480?1/2?240只要在传输给解码器的信息中，提供X,Y,Hi,Vi,i?1,2,3,4后，解码器即可算出各分量的象素数。

当前由于技术限制，许多DCT集成块每次只能处理8×8的方块，所以 JPEG标准把 8×8作为一方块(BLOCK)，块中64个象素作为一个数据单位。按照上述例子，亮度图象Y中4个(8×8)方块对应色度图象Cr 和 Cb 中各一个(8×8)方块。如图3.11所示。

8×88×8亮度Y:4个方块(a)Cr色度 :一个方块(b)8×8Cb色度 :一个方块(c)图3.11 Y, Cr ,Cb同一面积的取样方块数

根据图3.11所示的原理，在最小编码单元MCU中应当把JPEG亮度和色度变换单元送来的二个色度信号Cr 、Cb ，在行列方向按2:1合并，即将相邻4个象素合并成一个色度值。也就是说在MCU中把色度图象进行光栅转换。若把图3.11 中的 6个(8×8)方块作为一组，则可称之为最小编码单元MCU。按JPEG标准规定MCU中内插数据单元(即方块)最多为10个，即下式成立， MCU?在上述例子中 MCU??Hi?14i?Vi?10 (3-31)

?Hi?13i?Vi?2?2?1?1?1?1?6?10

图3.8中，最小编码单元MCU的作用就是把亮度及色度图象以MCU为单位顺序安排，依次送到DCT单元中。即如图3.12所示。图中Cij均为(8×8)方块。图3.12所示的最小编码单元的次序如下，

123411 MCU的次序为C11C1C1C1C2C3 567822 MCU2的次序为C1C1C1C1C2C3

318

1256C1C1C1C13478C1C1C1C11C22C21C32C3C1= YC2=Cr

图3.12 最小编码单元的次序

C3=Cb由图3.12可知，MCU内的顺序按Cij ,i?1,2,3,4安排。MCU本身的顺序，Cij的顺序以及Cij内象素的顺序均以从左到右，从上到下的顺序安排。

另外，如果在一帧图象中，行列方向象素数目不是8的整数倍，则需要通过光栅变换以达到 8的整数倍的要求。

5. 离散余弦变换DCT

该单元的作用是把MCU单元送来亮度、色度方块的数值进行二维离散余弦变换DCT。

JPEG采用的是8×8方块，因而二维离散余弦变换公式(3-28)变为：

771 F(u,v)?K(u)K(v)??f(x,y)

4x?0y?0 cos(2x?1)u?(2y?1)v?cos (3-32a)

1616177 f(x,y)???K(u)K(v)F(u,v)

4u?0v?0 cos其中

K(u),K(v)?1/2, 当u,v?0 K(u),K(v)?1, 其它

8×8方块的离散余弦变换可以采用二维快速离散余弦变换算法。8×8方块的离散余弦变换系数仍为 8×8矩阵，即含有64个系数。如同傅氏变换相当于进行频谱分解一样，余弦变换也相当于对8×8图象方块进行谐波分解。因而8×8余弦变换系数矩阵的左上角系数相当直流分量，右下角系数相当最高谐波分量。

6. 量化器

319

(2x?1)u?(2y?1)v?cos (3-32b)

1616 图3.8中量化器单元的作用是对 8×8余弦变换系数进行量化。量化的目的是对DCT系数进行压缩，实际上是用降低DCT系数精度的方法消去不必要的DCT系数，从而降低传输位率，即比特率。

JPEG中采用线性均匀量化器，量化定义为对64个DCT系数除以量化步长，经四舍五入取整，如下式所示。

FQ(u,v)?取整数?F(u,v)/Q(u,v)? （3-33）

其中Q(U，V)是量化器步长，它是量化表的元素。量化表元素随DCT系数的位置和彩色分量的不同有不同值。量化表的尺寸为8×8与 64个DCT系数一一对应。JPEG给出这个量化表的参考值，当然，它也可由用户规定。这个量化表存在量化器中。量化表中的每个元素值为1 到 255之间的任意整数，其值规定了它所对应DCT系数的量化步长。解码器中的反量化表达式如下式所示。

F?(u,v)?FQ(u,v)?Q(u,v) （3-34）量化的作用是在一定的主观保真度图象质量的前提下，丢掉那些对视觉效果影响不大的信息。不同频率的余弦函数对视觉影响不同，所以可根据不同频率的视觉阈值来选择量化表中的元素值的大小。这样通过心理视觉实验，可确定对应于不同频率的视觉阀值，以确定不同频率的量化器步长。图3.13示出量化特性。表3.2示出根据心理视觉加权函数而得的亮度分量量化矩阵，即亮度量化表。表3.3示出根据心理视觉加权函数而得到的色度分量量化矩阵，即色度量化表。

F(u,v)4321-0.5QF(u,v)/Q(u,v)0.51-4-3-2-1 ?2-1-2-3-4图3.13 量化特性

表3.2 亮度量化表

16 11 10 1612 12 14 1914 13 16 2414 17 22 2918 22 37 5624 35 55 6449 64 78 8772 92 95 98

24 40 51 61 26 58 60 55 40 57 69 56 51 87 80 62 68 109 103 77 81 104 113 92103 121 120 101112 100 103 99

320

共6页:

多媒体数据压缩(4).doc 将本文的Word文档下载到电脑下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档