《多媒体技术教程（第三版）》课后习题答案(2)

2019-04-22 08:29

据字符出现概率来构造，各码字长度严格按照所对应符号出现概率的大小逆序排列，具有即时性和惟一可译性。

行程编码有多种编码方式，对于0出现较多，1较少出现（或反之）的信源数据，可以对0的持续长度（或1的持续长度）进行编码，1（或0）保持不变。而对于0、1交替出现的数据，可以分别对0的持续长度和1的持续长度编码。这种编码适合于0、1成片出现的数据的压缩。为了保证解压缩时保持颜色同步，所有的数据行以白色行程代码字集开始。如果实际的扫描线从黑色行程开始，那么假设起始有白色的0行程。黑色或白色行程由规定的代码字来定义。代码字有两种类型：结束代码字和组成代码字。每个行程由0个或更多的组成代码字和一个确定的结束代码字来表示。在0～63范围内的行程由相应的结束代码字编码。64～2623（2560+63）范围内的行程首先由组成代码字编码，它表示最接近、但不大于所要求的行程，后再跟结束代码字。行程大于或等于2624时，首先由组成代码2560编码。如果行程的剩余部分仍大于2560，则产生附加的组成代码2560，直到行程的剩余部分少于2560，再按前述方法编码。如果一行的行程总量不等于图像宽度域中的值，则被认为是不可恢复的错误。

5．常见的声音压缩标准有哪些？它们分别采用什么压缩方法？常见的声音压缩标准有：

（1）电话质量的语音压缩标准

国际上从ITU-T最初的G.711使用 PCM编码标准开始，已制定了一系列的语音压缩编码的标准。这些压缩标准中充分利用了线性预测技术、矢量量化技术和综合分析技术，典型的标准和算法有G.721采用ADPCM、码本激励线性预测编码（CELP）、短时延码本激励线性预测编码（LD-CELP）、长时线性预测规则码激励（RPE-LTP）、矢量和激励线性预测编码（VSELP）等。下表为ITU建议的用于电话质量的语音压缩标准。 7

ITU建议的用于电话质量的语音压缩标准标准说明 G.711

采用PCM，采样速率为8kHz，量化位数为8bit，对应的比特流速率为64kbit/s。使用了非线性量化技术 G.721

将64kbit/s的比特流转换成32kbit/s的流，基于ADPCM；每个数值差分用4位编码，采样率为8kHz G.723

一种以24kbit/s运行的基于ADPCM的有损压缩标准 G.728

采用LD-CELP压缩技术；比特率为16kbit/s，带宽限于3.4kHz；音质与G.721标准相当（2）调幅广播质量的音频压缩标准

调幅广播质量音频信号的频率范围是50Hz～7kHz，又称“7kHz音频信号”，当使用16kHz的抽样频率和14bit的量化位数时，信号速率为224kbit/s。采用G.722标准进行压缩。（3）高保真立体声音频压缩标准

目前国际上比较成熟的高保真立体声音频压缩标准为“MPEG音频”。 6．常用的图像和视频压缩标准有哪些？它们分别采用什么压缩方法？

静止图像压缩标准有JPEG标准和JPEG 2000标准等，其中JPEG的压缩方法包括：（1）JPEG的无损预测编码算法

共15页第6页

（2）JPEG的基于DCT的有损编码算法

而JPEG 2000的压缩改用以离散小波变换算法为主的多解析编码方式，还将彩色静态画面采用的JPEG编码方式、2值图像采用的JBIG（Joint Binary Image Group）编码方式及低压缩率采用JPEGLS统一起来，成为对应各种图像的通用编码方式。

视频压缩标准有MPEG压缩标准、H.26L视频编码标准等。MPEG压缩标准中，MPEG-1是以两个基本技术为基础的。一是基于16×16子块的运动补偿，可以减少帧序列的时域冗余度。二是基于DCT的压缩技术，减少空域冗余度。MPEG-2标准的压缩编码系统编码有两种方法，其编码输出包括传送流和程序流两种定义流。传送流和协议ISO/IEC11172-1系统定义的流相似；程序流是一种用来传送和保存一道程序的编码数据或其数据的数据流。MPEG-4采用基于内容的压缩编码，将一幅图像按照内容分块，如图像的场景、画面上的物体被分割成不同的子块，将感兴趣的物体从场景中截取出来，进行编码处理。H.26L是一种高效的压缩方法，它集中了以往标准的优点，并吸收了标准制定中积累的经验。H.26L提供包传输网中处理包丢失所需的工具。H.26L在系统层面上提出了一个新的概念，在视频编码层（Video Coding Layer，VCL）和网络适配层（Network Adaptation Layer，NAL）之间进行概念性分割，前者是视频内容的核心压缩内容的表述，后者是通过特定类型网络进行传送的表述。这样的结构便于信息的封装和对信息进行更好的优先级控制。 7．JPEG标准的基本系统中压缩过程有哪几步？每步是如何工作的？ JPEG基本系统只采用顺序工作方式，其编码的简化框图如下图所示。有损压缩编码框图 8

压缩过程如下：

① 块准备。块准备是将一帧图像分成8×8的数据块。假设一个彩色图像由3种分量：光亮度Y和两个色差U和V表示，图像的大小为480行，每一行有640个像素。如果假设色度分解为4∶1∶1，则亮度分量就是一个640×480的数值矩阵，色差分量是一个320×240的数值矩阵。

② DCT变换。JPEG将源数据图像分成8×8大小的子块后，进行DCT变换。

③ 量化。为了达到压缩数据的目的，DCT系数需作量化。JPEG的量化采用线性均匀量化器。

④ DCT系数的编码。JPEG中对DC系数采用DPCM编码，即对相邻块之间的DC系数的差值进行编码。

⑤ 熵编码。JPEG建议使用两种基于统计特性的熵编码：Huffman编码和自适应二进制算术编码。可任选一种编码对第一个字节进行编码，第二个幅值字节不进行编码，仍然直接传送。 8．MPEG标准中减少时间冗余量的方法有哪些？

为了减少时间冗余量，MPEG将1/30s的时间间隔的帧序列电视图像，以3种类型的图像格式表示：内码帧（I）、预测帧（P）和插补帧（B）。帧间的信息用运动补偿的方法确定。运动补偿有两种算法，分别是运动补偿预测法和运动补偿插补法。（a）运动补偿预测法

画面上的运动部分在帧与帧之间必然有连续性，预测法根据这一特性，将当前的图像画面看作是前面某时刻图像的位移，位移的幅度和方向在图像画面的各处可有不同。因此，利用反映运动的位移信息和前面某时刻的图像，可以预测出当前的图像。（b）运动补偿插补法

用插补的方法进行运动的补偿，可以大幅度地压缩运动图像的信息。

在时域中插补运动补偿是一个多分辨率技术，可以以1/10s或1/15s的时间间隔取出参考子图，然后对这两个参考子图之间的图像，按照运动的规律得到1/30s时间间隔的各个插补子

共15页第7页

图。只要对参考子图及反映运动规律的信息进行编码，就可以得到帧率为30帧/秒的全运动视频图像。

9． MPEG标准系列已有哪些压缩标准？各有什么特点？适合用于什么场合下的数据压缩？

MPEG（Motion Picture Experts Group），已推出了MPEG（或MPEG-1）、MPEG-2、MPEG-4等系列标准。

（1）MPEG-1压缩标准 MPEG-1标准（ISO/IEC11172-Ⅱ）的目标是以约1.5Mbit/s的速率传输电视质量的视频信号，亮度信号的分辨率为360×240，色度信号的分辨率为180×120，每秒30帧。

MPEG-1视频压缩技术是以两个基本技术为基础的。一是基于16×16子块的运动补偿，可以减少帧序列的时域冗余度。二是基于DCT的压缩技术，减少空域冗余度。在MPEG中，不仅在帧内使用DCT，而且对帧间预测误差也作DCT，以进一步减少数据量。 MPEG-1标准包括MPEG系统（ISO/IEC11172-1）、MPEG视频（ISO/IEC11172-2）、MPEG音频（ISO/IEC11172-3）和测试验证（ISO/IEC11172-4）4部分内容。所以MPEG涉及的问题是视频压缩、音频压缩及多种压缩数据流的复合和同步问题。（2）MPEG-2压缩标准

MPEG-2标准的系统功能是将一个或更多的音频、视频或其他的基本数据流合成单个或多个数据流，以适应于存储和传送。MPEG-2系统支持五项基本功能分别是：解码时多 9

压缩流的同步、将多个压缩流交织成单个的数据流、解码时缓冲器初始化、缓冲区管理和时间识别。MPEG-2标准的压缩编码系统是将视频和音频编码算法结合起来开发的。

MPEG-2视频体系的视频分量的位速率范围大约为2Mbit/s～15Mbit/s。MPEG-2视频体系要求保证与MPEG-1视频体系向下兼容，并且同时应力求满足数字存储媒体、可视电话、数字电视、高清晰度电视（HDTV）、通信网络等领域的应用。分辨率有低（352×288）、中（720×480）、次高（1440×1080）、高（1920×1080）等不同档次，压缩编码方法也从简单到复杂有不同等级。

MPEG-2标准详细地叙述了数字存储媒体和数字视频通信中的图像信息的编码描述和解码过程。它支持固定比特率传送、可变比特率传送、随机访问、信道跨越、分级解码、比特流编辑以及一些特殊功能，例如：快进播放、快退播放、慢动作、暂停和画面凝固等。MPEG-2视频标准与ISO/IEC11172-2向前兼容，并与EDTV、HDTV和SDTV格式向上或向下兼容。 MPEG-2标准包括MPEG系统、MPEG视频、MPEG音频和一致性4部分内容，是运动图像及其伴音的通用编码国际标准。MPEG-2标准克服并解决了MPEG-1标准不能满足的日益增长的多媒体技术、数字电视技术、多媒体分辨率和传输率等方面技术要求的缺陷。（3）MPEG-4压缩标准

MPEG-4采用基于内容的压缩编码，将一幅图像按照内容分块，将感兴趣的物体从场景中截取出来，进行编码处理。MPEG-4具有高速压缩、基于内容交互和基于内容分级扩展等特点，并且具有基于内容方式表示的视频数据。MPEG-4在信息描述中首次采用了对象（Object）的概念。视频对象的构成依赖于具体应用和系统环境。 MPEG-4标准满足了随着网络和通信技术的迅猛发展、交互式计算机和交互性电视的逐步应用和视频音频数据的综合服务的发展，对计算机多媒体数据压缩编码的越来越高的要求。 10．H.26L标准的压缩编码有什么特点？（1）帧内预测

为了提高压缩效率，在帧内编码时也提供了多种预测编码模式；对于亮度块支持两种形式的帧内预测编码，即9种4×4块预测模式和4种16×16宏块预测模式，使预测更精确，编码

共15页第8页

效率更高。

（2）帧间预测补偿

运动补偿块的大小范围从16×16到4×4有多种选择；并支持1/4像素精度运动预测；支持多参考帧，最多可以到5个参考帧，由此可以更有利于帧间预测，减少帧间预测所得残差编码的比特数，提高编码效率。（3）具有块滤波器

在预测环中加入了去块效应滤波器，对相邻块的边界像素进行滤波，从而降低块的边界效应，边界处连接更自然，图像更细腻，主观质量更好。（4）变换编码

采用4×4块的整数变换作为基本变换编码，算法简单，速度快，无计算偏差。（5）熵编码

采用两种熵编码方式，一种是基于通用变长编码（UVLC），另一种是基于上下文的自适应二进制算术编码（CABAC），提高了压缩率。 10

第4章多媒体硬件环境

1．试述光存储的类型及主要原理。

常用的光存储系统有只读型、一次写型和可重写型光存储系统3类。

只读型光盘包括LV和CD-ROM（Compact Disc-Read Only Memory）等。CD-ROM只读式压缩光盘，其技术来源于激光唱盘，形状也类似于激光唱盘，能够存储650MB左右的数据。用户只能从CD-ROM读取信息，而不能往盘上写信息。CD-ROM中的内容在光盘生成时就已经决定，而且不可改变。CD-ROM盘常用于存储固定的软件、数据和多媒体演示节目。CD-ROM驱动器除了能读出CD-ROM盘外，还可以用于读取激光唱盘以及柯达激光照片的信息。一次写（Write Once Read Many，WORM）光存储系统可一次写入，任意多次读出。与CD-ROM相比，它具有由用户自己确定记录内容的优点。

可重写光盘（Rewritable或Erasable，E-R/W）像硬盘一样可任意读写数据。它又分磁光型（Magnetic Optical，MO）和相变型（Phase Change，PC）两种形式。 2．CD-ROM、CD-R、CD-RW三种光驱的差别有哪些？

CD-ROM是只读型光盘的缩写，其驱动器由光头、聚焦伺服、道跟踪伺服、CLV伺服、EFM解调、错误检测和校正处理6个部分组成。CD-ROM驱动器除了能读出CD-ROM盘外，还可以用于读取激光唱盘以及柯达激光照片的信息。

CD-R是一次写、多次读的可刻录光盘系统。CD-R刻录是将刻录光驱的写激光聚焦后，通过CD-R空白盘的聚碳酸脂层照射到有机染料（通常是箐蓝或酞箐蓝染料）的表面上，激光照射时产生的热量将有机染料烧熔，并使其变成光痕。

CD-RW是一种可改写的CD，其中RW是ReWritable的缩写。CD-RW的改写性是其最大优点，反射率仅为15%-20%，比较小，因而旧的CD-ROM驱动器不能读出。 3．什么是MIDI？它与波形音频的本质区别是什么？

MIDI（Musical Instrument Digital Interface）是指乐器数字接口，是数字音乐的国际标准。任何电子乐器，只要有处理MIDI消息的微处理器，并有合适的硬件接口，都可以成为一个MIDI设备。MIDI消息是乐谱的一种数字式描述。与波形声音相比，MIDI数据不是声音而是指令，所以它的数据量要比波形声音少得多。MIDI的另一个特点是，由于数据量小，所以可以在多媒体应用中与其他波形声音配合使用，形成伴乐的效果。对MIDI的编辑也很灵活，在音序器的帮助下，用户可以自由地改变音调、音色等属性，直到找到自己想要的效果。波形文件就很难做到这一点。但是，MIDI的声音尚

共15页第9页

不能做到在音质上与真正的乐器完全相似，在质量上还需要进一步提高；MIDI也无法模拟出自然界中其他非乐曲类声音。

4．视频卡与音频卡的核心部件是什么？

视频卡与音频卡的核心部件是编解码芯片，主要完成视频或音频信号的模数/数模转换，压缩/解压缩等功能。

从结构上分，音频卡可分为模数转换电路和数模转换电路两部分,模数转换电路负责将麦克风等声音输入设备采到的模拟声音信号转换为电脑能处理的数字信号；而数模转换电路负责将电脑使用的数字声音信号转换为喇叭等设备能使用的模拟信号。一般音频卡由下列部件组成：MIDI输入/输出电路；MIDI合成器芯片，用来把CD音频输入与线输入相混合电 11 路；带有脉冲编码调制电路的模数转换器，用于把模拟信号转换为数字信号以生成波形文件；用来压缩和解压音频文件的压缩芯片；用来合成语音输出的语音合成器；用来识别语音输入的语音识别电路，以及输出立体声的音频输出或线输出的输出电路等。 5．触摸屏可以分为哪几类，各自的特点是什么？

触摸屏按安装方式分，可分为以下4种。①外挂式：由用户自行把它挂到显示器的屏幕前，而且随时可以拆卸。②内置式：需拆卸显示器的外盖，把传感器夹在荧光屏玻璃与外盖之间。③整体式：传感器本身与显示器为一体的配置。④投影仪式：安装于大型投影屏前，可通过在投影屏的触摸来写字、绘图以及控制计算机流程等。

从结构特性与技术分有以下不同类型，包括红外、电阻膜、电容、表面声波、压力矢量等多种类型。

红外触摸屏原理是当用户触模屏幕时，手指会挡住经过该位置的横竖两条红外线，从而利用x、y方向上密布的红外线矩阵来检测并定位用户的触摸位置，执行该位置的图标或热点、热键。其主要特点是清晰度好，透光性高，防刮擦能力强，但其分辨率低，反应速度慢，不够美观。

电容式触摸屏的原理是用户触摸屏幕时，由于人体电场，手指与导体层间会形成一个锅台电容，四边电极发出的电流会流向触点，而电流的强弱与手指及电极间的距离成正比，位于触模屏幕后的控制器便会计算电流的比例及强弱，准确算出触摸点的位置。其主要特点是分辨率较高，反应速度较快，寿命较长，但怕硬物敲击，易受电磁干扰。电阻触摸屏的原理是当手指触摸屏幕时，两层导电层在触摸点位置就有了一个接触，控制器侦测到这个接通并计算出x、y轴的坐标。其主要特点是反应速度快，寿命长，不受电磁干扰，但怕锐器。

表层声波技术触摸屏的原理是当手指接触屏幕，便会吸收一部分声波能量，控制器依据减弱的信号计算出触摸点的位置。其主要特点是纯粹玻璃屏不怕刮擦和用力，寿命长，精度高，清晰透亮，还有压力轴响应。

压感触摸屏是在屏幕四角装上压力感应仪，当对触摸屏施加压力时，会由此引起感应仪电阻抗的变化，通过监测这些变化，就可计算出触摸点的确切位置和用力大小。

电磁感应触摸屏是基于笔输入式PC的主流技术，在笔尖上安装的一个非机械式开关将电容变化转变为频率变化，此开关还可使笔传感120级压力。 6．扫描仪的主要性能指标有哪些？扫描仪的技术指标主要有以下一些。

（1）原稿种类：透射或者反射原稿，连续调试线条稿，阳图或阴图原稿均可扫描分色。（2）扫描分辨率：决定了扫描仪的精度，分辨率越高，采样图像的清晰度也就越高。包括光学分辨率和间插分辨率。光学分辨率（采集到的图像细节数量）是要考虑的首要因素。光学分辨率取决于扫描头里的CCD数量。间插分辨率取决于扫描仪的硬件和软件。

共15页第10页

共4页:

《多媒体技术教程（第三版）》课后习题答案(2).doc 将本文的Word文档下载到电脑下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档