中国科大“多媒体技术”课程复习题整理 - 图文(9)

2020-06-21 15:10

或者就是简单的纯数据交流，它方式比较单一，功能有限，与会者只能进行片面的交流。而多媒体会议系统，利用全面的信息流来交换与会者的思想。这些信息流为实时音频和视频、同步或异步的多媒体数据。不仅可以传输多媒体数据，还提供了各种方式的共享空间和交流，有很强的交互性，是真正的属于与会者的会议。

70. 简述多媒体会议系统与传统的会议系统的区别？ P243,答多媒体会议系统的特征

71. 简述H.323电视会议系统结构，H.323定义了哪几种形式的多媒体会议？

①（PDF-ch7-P4~5）H.323是一个局域网上并且不保证服务质量的多媒体通信标准，包括以下组成部分：（1）H.323终端：它是局域网上的客户使用设备，提供实时的双向通信，必须支持H.245标准；（2）H.323网关：它是一个可选择部件，提供了许多服务，但最基本的是对在H.323会议终端与其他类型终端之间传输的数字信号进行转换；（3）H.323会务器：是最重要的部件，是它管辖区域里的所有呼叫的中心控制点，并且为注册的端点提供呼叫控制服务，执行两个最重要的呼叫控制功能（地址转换和网络管理功能）；（4）H.323多点控制单元：支持在3个或3个以上的端点之间召开电视会议。（PDF-ch7-P5）会议形式包括：（1）集中式电视会议；（2）分散式电视会议；（3）声像集散混合式多点电视会议；（4）会议集散混合式多点电视会议。

72. 多媒体会议系统的基本组成与一般结构是什么？网关和会务器的定义和功能如何？（书上有结构图）

①（教材P293）多媒体会议系统主要由终端设备、传输信道和多点控制单元等组成。网关：（PDF-ch7-P2）网关是一台功能强大的计算机或者工作站，它负担线路交换网络（如电话网络）和信息包交换网络（如因特网）之间进行实时的双向通信，提供异种网络之间的连通性，它是传统线路交换网络和现代IP网络之间的桥梁。（PPT-ch7-P3）网关基本功能：转换协议、转换信息格式和传输信息。会务器：（PDF-ch7-P3）会务器是用于连接IP网络上的H.323电视会议客户，是电视会议的关键部件之一，它提供授权和验证、保存和维护呼叫记录、执行地址转换而不需要记忆IP地址、监视网络、管理带宽以限制同时呼叫的数目从而保证电视会议的质量以及提供与现存系统的接口。基本功能：地址转换、准入控制、带宽控制和区域管理，还提供许多选择功能。

综合类

73. 视频信号传输的时候，哪些系统采用了基带传输方式，哪些采用了频带传输方式？

传统的电视系统如PAL，NSTC等模拟电视系统，电话系统还有局域网系统是采用基带传输。而对于数字电视等数字格式以及现在网络上的视频传输以及远程的网络传输都是采用频带传输。

74. 总结音频编码技术发展过程中主要思路的变迁。

⑴基于音频数据的统计特性进行编码

基于音频数据的统计特性进行编码，其典型技术是波形编码。不利用声音的任何知识，数据率较高，实现简单。其目标是使重建语音波形保持原波形的形状，如PCM、DPCM、ADPCM、SB-ADPCM等。

① PCM编码：在G.711标准中体现。它是将原始的模拟信号经过时间采样，然后对每一样值进行量化，作为数字信号传输。一般采用非均匀量化方式，包括μ律(μ-Law) 和A律(A-Law)。 ②DPCM差分编码调制:通过记录预测值与实际信号的差实现压缩

③APCM自适应脉冲编码调制: 通过调整量化阶实现压缩,自动调整量化阶△的大小；在检测到斜率过载的时候增大△，在输入信号斜率减小时降低△

④△M增量调制,通过记录差值实现压缩

⑤ADPCM自适应差分脉冲编码调制(G.721 32kb/s):4bit,是DPCM和APCM思想的集合

⑥SB-ADPCM子带-自适应脉冲编码调制(G.722 48kb/s +16kb/s):低频/高频子带。通过改变不同子带样本的比特分配实现压缩（听觉特性）。G.722标准把采样频率由8kHz提高到16kHz；信号频率由原来的3.4 kHz扩展到7 kHz；低频端把截止频率扩展到50 Hz. ⑵基于音频的声学参数进行参数编码

其目标是使重建音频保持原音频特性。常用的音频参数有共振峰、线性预测系数、滤波器组等。从声音的波形中提取生成话音的参数。这种编码技术的优点是数据率低，但还原信号的质量较差，自然度低。

?LPC记录的是信道模型的参数起因：

①一般的语音传输每隔20ms传输一次，话音在短时间周期(20 ms的数量级)里可以被认为是准定态(quasi-stationary)的，也就是说基本不变的。

?②波形编码的数据量大：20ms的CD音乐的存储量，20ms/1000ms*44.1k*2byte*2=3.528kB；20ms的G.721的存储量，20ms/1000ms*64kbps=1.28kb

?③用声道参数表示声音：LPC速率2.4kbps(平均20ms传输48bit) ⑶混合编码

将上述两种编码算法很好地结合起来，采用混合编码的方法。这样就能在较低的码率上得到较高的音质。如MPE、RPE、CELP等。MPE、RPE改变激励获取不同的效果，CELP通过建立码本进一步压缩

⑷基于人的听觉特性进行编码

?从人的听觉系统出发，利用掩蔽效应，设计心理声学模型，从而实现更高效率的数字音频的压缩。其中以MPEG标准中的高频编码和Dolby AC-3最有影响。

?①MPEG1 Layer1/2/3，基于听觉特性的变换域编码。Layer1，利用频域掩蔽特性；layer2,利用频域和时域掩蔽特性；layer3，利用频域和时域掩蔽特性，考虑立体声数据冗余和使用霍夫曼编码器。

②MPEG2 BC & AAC ，基于听觉特性的变换域编码。

I．MPEG-2 BC ,增加了16 kHz, 22.05 kHz和24 kHz采样频率;输出速率由32～384 kb/s扩展到8～640 kb/s;支持5.1声道和7.1声道的环绕声;支持Linear PCM和Dolby AC-3编码. II．MPEG-2 AAC,利用掩蔽特性减少数据量，并把量化噪声分散到各个子带中，用全局信号把噪声掩蔽掉;采用频率可从8 kHz到96 kHz，可支持声道数目极多

③MPEG4 Audio使用了参数编码和混合编码。可集成从话音到高质量的多通道声音，从自然声音到合成声音，编码方法还包括参数编码，码激励线性预测编码，时间/频率T/F编码，结构化声音SA编码和文本-语音TTS系统的合成声音等。 ⑸ 移动通信中的音频编码（额外的，写也可不写也可）

①GSM网络中的音频编码,如果以8 kHz采样率及13位精度来对出自GSM蜂窝手机麦克风的音频数据进行采样，则可得到104kbps的源数据速率。GSM系统中有四种编解码器，分别执行：全速率、增强型全速率(EFR)、自适应多速率(AMR)及半速率语音压缩。

②3G中AMR,AMR声码器采用ACELP编码方式，提供了8种编码速率(4.75~12.20kbit/s) ，每种速率都有不同的容错率。

75. 总结视频编码技术发展过程中主要思路的变迁。

⑴ 经典编码方法——―第一代”

预测编码思想：根据数据的统计特性得到预测值，然后传输图像像素与其预测值的差值信号，使传输的码率降低，达到压缩的目的。

?变换编码思想：由于数字图像像素间存在高度相关性，因此可以进行某种变换来消除这种相

关性。例如二维DCT变换。

?统计编码思想：根据信息码字出现概率的分布特征而进行压缩编码，寻找概率与码字长度间的最优匹配。常用的统计编码有游程编码、Huffman编码和算术编码三种。以上为经典编码方法，但是经典编码方法存在局限性

第一代压缩编码方案把视频序列按时间先后分为一系列帧，每一帧图像又分成宏块以进行运动补偿和编码，这种编码方案存在以下缺陷：

?①将图像固定地分成相同大小的块，在高压缩比的情况下会出现严重的块效应(马赛克效应) ?②不能对图像内容进行访问、编辑和回放等操作

?③未充分利用人类视觉系统（HVS，Human Visual System）的特性。 ⑵第二代”编码方法

第一代”编码技术以信息论和数字信号处理技术为理论基础，旨在去除图像数据中的线性相关性。压缩比不高，约在10∶1左右。

?而“第二代”编码技术不局限于信息论的框架，要充分利用人的视觉生理、心理和图像信源的各种特征，实现从“波形”编码到“模型”编码的转变，以便获得更高压缩比。其压缩比多在30∶1至70∶1之间。

?“第二代”编码方法充分利用计算机图形学、计算机视觉、人工智能与模式识别等相关学科。编码方法主要有：基于分形的编码、基于模型的编码、基于区域分割的编码和基于神经网络的编码等。从当前发展情况来看，“第二代”编码方法仍处于深入研究的阶段。 ⑶过渡编码技术

近年来，出现了一类充分利用人类视觉特性的“多分辨率编码”方法，如子带编码、塔形编码和基于小波变换的编码。

?这类方法使用不同类型的一维或二维线性数字滤波器，对视频（图像）进行整体的分解，然后根据人类视觉特性对不同频段的数据进行粗细不同的量化处理，以达到更好的压缩效果。 ?这类方法原理上仍属于线性处理，属于“波形”编码，可归入经典编码方法，但它们又充分利用了人类视觉系统的特性，因此可以被看作是“第一代”编码技术向“第二代”编码技术过渡的桥

76. 讨论半导体存储、光存储、磁存储、网络存储在应用领域方面的差异。

半导体存储器磁表面存储器光存储器网络存储：网络存储的应用可以说从网络信息技术诞生的那天就已经开始，应用的领域随着信息技术的发展而不断增加，但大的分类包括以下四类：

①ISP的全称是InternetServiceProvider,即互联网服务提供商;目前国内主要的ISP商家有中国电信,中国网通,中国联通,中国铁通,中国教育与科研网,长城宽带。

②ICP是Internet Content Provider的缩写，意为“Internet内容提供商”，即提供Internet信息搜索、整理加工等服务。如新浪、搜狐等。

③ASP是Application Service Provider的缩写，意为“网络应用服务商”，主要为企、事业单位进行信息化建设、开展电子商务提供各种基于Internet的应用服务。

④NSP是Network Storage Provider的缩写，意为“网络存储服务商”，主要为企业，个人提供网络存储、传输、处理等服务的商家，如DBank数据银行、 IDC企业。

ROM、RAM（内存）、闪存（优盘）硬盘、软盘、磁带 CD-ROM、DVD-ROM

77. 你认为在多媒体信息传输过程中，最大的问题是什么？应该如何解决？

衡量多媒体传输的主要技术指标是：延迟、抖动、丢包率。延迟是分组的第一位离开发送端与分组的最后一位到达接收端的时间间隔。抖动是分组延迟的变化程度。丢包率是一定时间间隔内，丢失的分组／传输的分组总数。在Internet上进行多媒体传输巨大流量和连续媒体的实时性要求是重要的环节。多媒体应用在一定程度上能容忍不可靠传输，分组也不必按顺序到达，甚至丢失分组可不予考虑或可用某些数据近似代替，但他不能容忍长时间的延迟停顿。所以必须保证多媒体传输的实时性、低延迟、低丢包率、低抖动。由于传统的IP只有一种服务类型，即尽力而为的(best-effort)服务模型，他对所有的分组同等对待，路由器采取FIFO(先进先出)的调度转发算法，所以不能保证多媒体数据包的实时性、低延迟、低抖动、低丢包率。为了保证多媒体数据的传输必须提高Internet的QoS(服务质量)。QoS就是能够对数据包进行合理的排队，对含有内容标识的数据包进行优化，并对其中特定的数据包赋以较高的优先级，从而加速传输的进程，并实现实时交互 1. 综合业务

基本思想是在数据包经过的路径上的每个节点预留资源（TDMA电路交换中的一个时隙或者IP路由器中的缓冲区）网络总体的一个控制 2. 区分业务

其基本思想是在数据包经过的每一个节点按照预先定义的优先级进行转发网络中各个节点分布式的控制

3. IP网络多媒体传输解决方案，（1）New-RSVP （2）边缘路由器（3）核心路由器

78. 通过调研讨论PPLive系统的原理。

P2P 流媒体网络电视组成结构

P2P 网络电视通信网络中主要有P2P 节目源服务

器、Web 服务器、Tracker、普通节点等部分。P2P 节目源服务器从视频源服务器获得视频数据并以P2P 形式发布。与普通节点不同，P2P 服务器只上传数据不下载数据。Web 服务器的主要功能是提供节目列表和版本的更新。Tracker 的直译意思是“追踪者”，通过它可以追踪节点的信息。节点根据这些信息来和其他节点建立连接。节点指的是加入P2P 网络的普通用户，每个节点都同时上传和下载，进行数据交换。

PPLive 工作原理

PPLive 是基于P2P 技术的全球最大的网络电视[2]。PPLive的P2P 引擎和播放器是分开的，引擎为播放器提供数据，播放器为用户提供了播放界面，如图1 所示[3]。PPLive 的主要部件是它的电视引擎，它负责从PPLive 网络下载视频数据块，并将下载的视频流发到媒体播放器。与传统的C/S 模式不同，一个加入P2P 网络中的节点从许多和自己相同的节点处获得视频数据，然后把获得的一块块不连续的数据在缓冲区中按照视频播放的时间顺序排列好，推向播放部分。 3．2 Peer 与Tracker 之间的交互

当用户启动PPLive 软件时，首先向Web 服务器发送查询信息，获取最新的频道列表。当Peer 选择看某个电视频道时，它向服务器发送多个查询消息，以获取该频道的在线Peer 列表，列表上

用IP 地址和端口号来标识一个Peer。

79. 讨论在因特网上实现IPTV系统和移动通信网（如基于WCDMA的3G网络）上实现IPTV系统存在哪些差异？

IPTV即网络电视，它集Internet、多媒体和通信等多种技术于一体，利用宽带网的基础设施，以家用电视机(或计算机)作为主要终端，通过IP协议向用户提供电视节目在内的多种交互式数字媒体服务及其增值业务。IPTV的最大优势在于“互动性”和“按需观看”，彻底改变了传统电视单向广播的特点。根据设备的功能，一个典型的IPTV系统可以分为媒体平台层、服务支持层、运营支撑层、IP承载层和终端层等五层。 IPTV技术形式

虽然都是IPTV，但技术形式并不一定相同。按照不同的应用方向，技术上IPTV可以细分为IPTV-T、IPTV-P、IPTV-H。IPTV-T代表以电视机(TV)为显示终端的系统，它采用较高的码率，实现D1格式的标准清晰度的图像显示；IPTV-P代表以计算机(PC)为显示终端的系统，采用中低码率，实现CIF格式的图像显示；IPTV-H代表以移动手持设备(Handset)为显示终端的系统，采用低码率，实现QCIF大小的图像显示。目前IPTV的应用领域主要是这三大块。

无论采取哪种形式，IPTV系统的核心框架结构是一致的，包含：编码系统、流媒体服务器、视频节目存储、认证计费、数字版权保护。而双向接入方式和解码终端，则要视具体应用而定。 IPTV-T

编码采样使用D1格式，压缩效果基本达到标清电视的质量，采用MPEG-4或H.264，输出码率大约为1.5Mb/s，占用的带宽也较大，目前适合在一些专网中传输。如果也传输实时电视节目，比如卫星数字电视节目，那么也可以算是数字电视(DTV)的一种形式。 IPTV-P

适合计算机用户通过Internet来获取视音频资料，编码的输出码率能够匹配目前的接入手段(如ADSL)，采用MPEG-4编码，采用CIF格式，输出码率大约为300～700kb/s。 IPTV-H

专门针对移动接收手持设备而使用，低码率，以QCIF格式为主。中国移动开展的IPTV业务是基于其GPRS网络，码率在35kb/s以内。中国联通开展的IPTV业务则是依靠其CDMA1X网络传输，用户网络带宽最高可以达到100kb/s。未来3G网络的传输速率可以在1Mb/s以上。随着技术的进步和带宽的提高，IPTV的这种技术细分也会发生变化。

80. 讨论三网融合的内容。

三网融合是指电信网、计算机网和有线电视网三大网络通过技术改造，能够提供包括语音、数据、图像等综合多媒体的通信业务。

三网融合是一种广义的、社会化的说法，在现阶段它是指在信息传递中，把广播传输中的“点”对“面”，通信传输中的“点”对“点”，计算机中的存储时移融合在一起，更好为人类服务，并不意味着电信网、计算机网和有线电视网三大网络的物理合一，而主要是指高层业务应用的融合。其表现为技术上趋向一致，网络层上可以实现互联互通，形成无缝覆盖，业务层上互相渗透和交叉，应用层上趋向使用统一的IP协议，在经营上互相竞争、互相合作，朝着向人类提供多样化、多媒体化、个性化服务的同一目标逐渐交汇在一起，行业管制和政策方面也逐渐趋向统一。所谓“三网融合”，就是指电信网、广播电视网和计算机通信网的相互渗透、互相兼容、并逐步整合成为全世界统一的信息通信网络。“三网融合”是为了实现网络资源的共享，避免低水平的重复建设，形成适应性广、容易维护、费用低的高速宽带的多媒体基础平台。

“三网融合”后，民众可用电视遥控器打电话，在手机上看电视剧，随需选择网络和终端，只要拉一条线、或无线接入即完成通信、电视、上网等。

意义：它不仅是将现有网络资源有效整合、互联互通，而且会形成新的服务和运营机制，并有利于信息产业结构的优化，以及政策法规的相应变革。融合以后，不仅信息传播、内容和通信服务的方式会发生很大变化，企业应用、个人信息消费的具体形态也将会有质的变化。（百度

共9页:

中国科大“多媒体技术”课程复习题整理 - 图文(9).doc 将本文的Word文档下载到电脑下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档