2011.6.15————————————————————上大春季学期多媒体复习资料—— 第一章
多媒体的含义
多媒体与超媒体的关系 VRML与HTML
无损压缩与有损压缩的概念
第二章
冗余的概念
*视听冗余;数据冗余;决策量;信息量;熵;数据冗余量 *压缩比的理论值;压缩比的实际值 信息量=数据量-冗余量 Huffman编码,平均码长的计算 RLE编码 词典编码的思想 LZW编码和译码
第三章
声音信号的频率与幅度
*声音的三要素为声调(声音频率的高低)、音量(强弱)和音色(混入基音中的泛音决定)。 *声波的振幅表示声音信号的强弱程度。声波的频率(周期的倒数)反映出声音的音调 *亚音,声音,话音 模拟信号与数字信号
*我们把在时间和幅度上都是连续的信号称为模拟信号。时间和幅度都用离散的数字表示的信号就称为数字信号。
亚音信号、语音信号、超声波信号、音频信号 采样、均匀采样、非均匀采样
*在某些特定的时刻对这种模拟信号进行取值叫做采样 量化、线性量化、非线性量化
*采样值用二进制数字表示的过程称为量化
采样频率如何确定、量化精度代表什么含义
*每秒钟需要采集多少个声音样本,叫采样频率;采样频率不应该低于声音信号最高频率的两倍,此时可以达到无损数字化;每个声音样本的位数,叫量化精度; *信噪比:SNR(dB):6.02n(n表示采样精度) 声音数据量的计算
G.711标准的μ(A)率压扩 斜率过载、粒状躁声
*增量调制器的输出不能跟踪输入信号的快速变化,叫做增量调制器的斜率过载;
*输入信号和预测信号的差值接近0的区域,增量调制器的输出出现随机交变的0和1,这种现象叫做增量调制器的粒状噪声; 多路复用技术
*频分多路复用:在一条通信线路上使用不同频段同时传送多个独立信号的通信方法; *时分多路复用:??使用不同时段?? APCM、DPCM、ADPCM、SB-ADPCM
MIDI的含义
*电子乐器数字接口,用于在音乐合成器、乐器和计算机之间相互连接并交换音乐信息的一种标准协议
第四章
RGB颜色空间、CMYK颜色空间
图像的主要指标:图像分辨率、颜色深度
*图像分辨率是指组成一幅图像的像素密度的度量方法;像素深度是指存储每个像素所用的位数;
图像数据量的计算
*图像数据量大小 = 分辨率×图像深度÷8 真彩色、伪彩色、直接色
*真彩色是指在组成一幅彩色图像的每个像素值中,有R,G,B三个基色分量;伪彩色图像的含义是把像素值当作彩色查找表(color look-up table,CLUT)的表项入口地址,去查找一个显示图像时使用的R,G,B值,用查找出的R,G,B值产生的彩色称为伪彩色。通过相应的彩色变换表找出基色强度,用变换后得到的R,G,B强度值产生的彩色称为直接色。 矢量图、位图,矢量图的优缺点
*矢量图是用一系列计算机指令来表示一幅图,矢量图的缩小放大、旋转、拷贝、属性的改变非常容易做到,缺点:速度慢,对真实世界的彩照很难用数学方法来表示;位图是用像素值阵列表示的图;
JPEG编码的计算过程,压缩率,压缩比的计算
*压缩率=压缩后输出的数据位数/样本数;压缩比=不压缩时所使用的数据位数/压缩后输出的数据位数
*因此得到压缩后编码的数据是:
011 11 11011 01 00 0 00 0 00 0 11100 0 1010
压缩后的数据为31位,而64个系数正常需要64x8 位,其压缩比为:64x8/31≈16.5,压缩率为31/64≈0.5位/样本。
BMP文件结构
*位图文件头,位图信息头,彩色表,图像数据阵列字节;
第九章
电视的几种制式
*彩色电视制式:NTSC,PAL,SECAM
*NTSC每帧525条扫描线,隔行扫描,30帧每秒视像带宽4.2MHZ,使用YIQ信号;PAL?625条??25帧每秒??至少4MHZ,使用YUV颜色模型 PAL制式的参数 NTSC制式的参数 隔行扫描、逐行扫描
*黑白和彩色电视都用隔行扫描,计算机采用逐行扫描;
*逐行扫描:电子束从显示屏的左上角一行接一行地扫到右下角;隔行扫描:电子束扫完第一行后从第三行开始扫?一直扫到最后一行的中间,奇数行扫完后扫偶数行 复合电视信号、分量电视信号、S-Video电视信号
*包含亮度信号,色差信号和所有定时信号的单一信号叫做复合电视信号;使用三个分离的
颜色分量和同步信号进行记录和传输的电视信号叫做分量电视信号;S-Video是亮度信号Y和色度信号C分开录制和处理的一种电视信号; 图像子采样的原理、样本点数的计算
*如果对色差信号使用的采样频率比对亮度信号使用的采样频率低,这种采样就称为图像子采样
第十章
MPEG-1视像格式、MPEG-2视像格式
*MPEG-1,VCD,PAL:分辨率360像素/行*288行/帧*25帧/秒,数据位速率:1.5Mb/s,视像输出速率:1.15Mbps
*MPEG-2,DVD,PAL:分辨率720像素/行*576行/帧*25帧/秒,??:15Mb/s *3种可变性:信噪比可变性,空间分辨率可变性,时间分辨率可变性 MPEG-1的分辨率、数据速率、视像数据速率 MPEG-4的含义(视听对象编码)
*MPEG-4是为视听数据的编码和交互播放开发算法和工具,是一个数据速率很低的多媒体通信标准。 MPEG-7的含义
*MPEG-7的名称叫做多媒体内容描述接口,目的是制定一套描述符标准,用来描述各种类型的多媒体信息及它们之间的关系,以便更快更有效地检索信息
第十一章
听阈、痛阈,随频率变化曲线
*测量响度时是以1 kHz纯音为基准。当声音弱到人的耳朵刚刚可以听见时(0dB声强级),我们称此时的声音强度为“听阈”。如果频率为1kHZ的纯音的声强级达到120dB左右,声音强到使人耳感到疼痛这个阈值称为“痛阈”。 掩蔽效应、频域掩蔽、时域掩蔽
*一种频率的声音阻碍听觉系统感受另一种频率的声音的现象称为掩蔽效应。前者称为掩蔽声音,后者称为被掩蔽声音。掩蔽可分成频域掩蔽和时域掩蔽。一个强纯音会掩蔽在其附近同时发声的弱纯音,这种特性称为频域掩蔽,也称同时掩蔽;①在250 Hz,1 kHz和4 kHz纯音附近,对其他纯音的掩蔽效果最明显,②低频纯音可以有效地掩蔽高频纯音,但高频纯音对低频纯音的掩蔽作用则不明显。除了同时发出的声音之间有掩蔽现象之外,在时间上相邻的声音之间也有掩蔽现象,并且称为时域掩蔽。时域掩蔽又分为超前掩蔽和滞后掩蔽。产生时域掩蔽的主要原因是人的大脑处理信息需要花费一定的时间。 感知声音编码
*感知编码是一种声音数据压缩技术,它处理10 Hz~20000 Hz范围里的声音数据,数据压缩的主要依据是人耳朵的听觉特性,使用“心理声学模型”来达到压缩声音数据的目的。 MPEG声音的三个层次,分别使用什么特性
*MP1 使用频域掩蔽特性,压缩比4:1,数据率384kbps;MP2 使用频域掩蔽特性,时间掩蔽特性,压缩比6:1-8:1,数据率256-192kbps;MP3 使用频域掩蔽特性,时间掩蔽特性和临界频带特性,压缩比 10:1-12:1,数据率128-112kbps,声音质量接近CD-DA MPEG-2 Audio与MPEG-1 Audio
*一种称为MPEG-2 Audio,或者称为MPEG-2多通道(Multichannel)声音,另一种称为MPEG-2 AAC,前者与MPEG-1 Audio是兼容的,而后者是不兼容的。 MPEG-2 AAC
第十二章
各种冗余的概念
*时间冗余:在某个时间间隔上出现相同或基本相同的连续帧时,帧与帧之间存在大量的冗余数据;空间冗余:在单帧图像中相邻像素的值常有相同或变化不大的情况,可用比较少的数据来表达这些像素的值,
MPEG三类视频图像,采用的压缩技术,压缩比的比较
*三种类型的图像:帧内图像I,压缩率最低,预测图像P,双向预测图像B,压缩率最高; MPEG压缩时保存的值
*空间分辨率是指一帧图像包含的行数与每行显示的像素数之乘积,而时间分辨率是指每秒种显示或者传输的图像帧数。
第十四章
CD的光道与磁盘的磁道
*CD盘光道的结构与磁盘磁道的结构不同,磁盘的磁道是同心环,好处是控制简单,便于随机存取;光盘的光道是螺旋型,好处是可以达到应有的数据存储容量,但控制比较复杂; CD-ROM的凹坑与非凹坑,如何表示0和1 *利用凹坑的边缘来记录“1”,而凹坑和非凹坑的平坦部分记录“0”,使用激光来读出 CD-Audio的采样频率与精度
*选用了44 100 Hz作为激光唱盘声音的采样标准。激光唱盘音乐信号的样本位数是16。 *1秒*44 100样本/秒*2字节/样本*2(左右两个通道) = 176.4 千字节
通道编码
*声音转换成用“1”和“0”表示的数字信号之后,并不是直接把它们记录到盘上。物理盘上记录的数据和真正的声音数据之间需要做变换处理,这种处理统称为通道编码。 EDC、ECC
*错误检测码,纠错码 DVD存储容量的提高
*使用波长较短的激光,加大光盘的记录区域,使用双面和多层记录,改进调制和纠错方法
第十五章
CD盘的物理格式和逻辑格式
*物理格式规定数据如何放在光盘上;逻辑格式规定如何把文件组织到光盘上以及指定文件在光盘上的物理位置;
各种光盘的格式:CD-DA、CD-R、CD-RW、CD-ROM
CD-DA:一个扇区多少帧,每帧多少声音数据,一秒钟多少扇区、多少帧 *一个扇区98帧,每帧24字节,一秒钟75扇区,一秒钟7350帧 CD-ROM Mode1存放什么 *存储计算机数据;
CD-ROM Mode2存放什么
*存储声音数据,静态图像或电视图像数据,yellow book比red book解决了计算机的寻址问题和误码率问题;
扇区地址的含义,扇区的大小
*磁盘的扇区地址是用C-H-S(柱面号-磁头号-扇区号),CD-ROM是用计时系统中的分,秒以及特地为CD-ROM规定的分秒(1/75秒)来表示,一个扇区有3234字节
CD-ROM的速率 150KB/S
*red book专门为CD-DA制定;yellow book专门为CD-ROM制定; CD-ROM/XA的优点
逻辑扇区的大小 2048,逻辑块的大小 512 1024 2048 目录结构 *隐式分层
第十六章 CRC的计算 CRC的纠错原理 RS编码的含义