字符序列:aba bbbdd 编码为:abac7bbbdd (2)行程编码法的特点:
不必预先定义模型、直观、经济 行程编码是一种无损压缩方法 压缩比取决于图像本身特点 适用于计算机生成的图像
61、霍夫曼编码:
方法:(1)信源符号按概率递减顺序排列
(2)将最小的两个概率加起来作为新符号的概率 (3)重复第一步和第二步,直到概率和为1
(4)完成上述步骤后再沿路径返回编码,寻找从每一个信源符号到概率为1的路径,每一层有两个分支,分别赋予0,1(概率大为1,小为0。数字相同时上方编码为1,下方编码为0)。 例:已知7个信源符号{a1,a2,a3,a4,a5,a6,a7}的概率顺序为{0.35,0.20,0.15,0.12,0.10,0.05,0.03},试进行霍夫曼编码,并计算平均码长、压缩比。 结束 第六步 第五步 第四步 第三步 第二步 第一步 信源符号 码字 码长 0.35(11) 0.35(11) 0.35(11) 0.35(11) 0.35(11) a1 11 0.62(1) 0.27(10) 0.27(10) 0.15(101) 0.15(101) 0.15(101) a3 101 0.12(100) 0.12(100) 0.12(100) a4 100 0.20(01) 0.20(01) 0.20(01) 0.20(01) a2 01 0.10(001) 0.10(001) a5 001 1 0.38(0) 0.38(0) 0.18(00) 0.18(00) 0.08(000) 0.050.03(0001) (0000) a6 0001 4 a7 0000 4 2 3 3 2 3 码字的平均码长Lc,Pj为信源符号aj出现的概率,Lj为编码长度 n 7
Lc=∑PjLj=∑PjLj=(0.35+0.20)×2+(0.15+0.12+0.10)×3+(0.05+0.03)×4=2.53(b)
j=1
j=1
压缩比:C=L÷Lc=3÷2.53=1.19 62、预测编码:
原理:预测编码根据某一模型利用以往的样本值对于新样本进行预测,并将样本的实际值与预测值相减得到一个误差值,然后对这一误差值进行编码。
预测编码可以获得比较高的编码质量,并且实现起来比较简单,因此被广泛应用在图像压缩编码系统中。
63、变换编码:是采用一种函数变换的思想,将信源从一个描述域变换到另一个描述域。 64、电话语音压缩标准:最简单的波形编码是脉冲编码调制,电话质量语音信号的频率范围是300Hz~3.4kHz,采用标准的PCM,采样频率为8kHz,量化位数为8b,所对应的速率为64kbps。
65、高保真立体声音压缩标准的频率范围为50Hz~20kHz
66、国际标准化组织和国际电报电话咨询委员会联合成立的“联合照片专家组”JPEG与1991年对静止图像压缩提出了JPEG标准,它是国际上第一个彩色、灰度、静止图像的国际标准。 67、运动图像压缩标准:MPEG
MPEG-1:主要用于音视频的存储等应用。1992年发布 MPEG-2:数字电视标准,1994年颁布
MPEG-3:已合并到高清晰度电视(High-Definition TV,HDTV)工作组。 MPEG-4:多媒体应用标准(1999年发布)
68、MPEG标准分为MPEG视频、MPEG音频、和MPEG系统三部分。 69、MPEG将图像分为三种类型:内码帧I、预测帧P和双向帧B。
(1)I帧,是完整的独立编码的图像,是不能由其他帧构造的帧,必须存储和传输。 (2)P帧,通过对之前的I帧或P帧进行预测,并对预测误差进行有条件的存储和传输。 (3)B帧,根据前后I帧或者P帧的信息进行插值编码获得。
70、MPEG-7标准称为“多媒体内容描述接口”,它扩展了现有编码内容识别专用解决方案的有限能力,特别是包括更多数据类型。
71、MPEG-7标准的重点在于影音内容的描述和定义,以明确的结构和语法来定义影音资料的内容。
72、H.26x系列标准时ITU-T制定的面向可视通信领域的国际标准。
73、声音的产生:声音是由物体的振动产生的。由于振动产生的声波传入人耳,到达鼓膜,使鼓膜发生振动。鼓膜的振动通过耳小骨和淋巴液传递到“基底膜”,最终引起有毛细胞的纤毛振动,激起神经细胞信号。这种神经细胞信号传递到大脑,人们便感知到了声音信号。大脑对声音信号进行解读,人就获得了听觉信息。
74、声音的三要素:响度,音调,音色
75、响度又称音强,是人主观上感觉到的声音大小,由声波的振幅决定,振幅越大,响度就越大,响度单位是分贝。
76、当声音弱到人耳刚刚可以听见时,称此时德尔音强为“听阈”。另一种使人耳感到疼痛的声音音强称为“痛阈”。在听阈和痛阈之间的区域就是人耳的听觉范围,人类能够感知的声音幅度范围为0~120dB。
77、音调是声音的高低,是人对声音频率的感觉。人耳听觉频率范围是20Hz~20kHz,人的发生频率约为85Hz~11kHz,话音频率一般为300~3400Hz。 78、声音质量等级由高到低一次是DAT→CD→FM→AM→电话。 79、1kHz纯音的声强打到10W/cm(0dB)人耳刚能可闻。 80、实验表明,如果频率为1kHz的纯音的声强级达到120dB左右,人的耳朵就会感到疼痛,这个阈值称为“痛阈”。 81、频域掩蔽:对于频率相近的声音,响度高的阻碍另一个响度较低声音的听觉感知的现象,称为频域掩蔽效应。
82、时域掩蔽:在时间上相邻的声音之间存在掩蔽现象,称为时域掩蔽。
83、MPEG声音编码指MPEG-1 Audio、MPEG-2 Audio和MPEG-2 AAC声音编码。MPEG声音编码进行数据压缩编码的主要依据是人耳的听觉特性,据此建立“心理声学模型”,从而控制、实现音频数据压缩。
84、心理声学模型的一个基本依据是听觉系统中存在一个听觉阈值电平,低于这个电平的声音信号,人耳就听不见,因此就可以把这部分声音数据去掉。
85、MPEG-1音频编码依靠心理声学模型进项数据压缩编码,心理声学模型是依据人耳听觉感知特征建立的。
86、MPEG-2标准委员会定义了两种音频数据压缩编码,一种为MPEG-2 Audio,另一种为
-16
2
MPEG-2 AAC。
87、常见音频格式(了解):WAV,MP3,WMA,CDA,APE,FLAC,MIDI
88、Audition具有的基本技术特征:按时间线方式工作,支持128条音轨、多种音频特效、多种音频格式,可以很方便地对音频文件进行修改、合并操作。提供高级混音、编辑、控制和特效处理能力,允许用户编辑个性化的音频文件。支持实时特效、环绕声、分析工具、MIDI、视频功能等。
89、MIDI是一种国际标准,是计算机和MIDI设备之间进行信息交换的一整套规则,包括记录、表示、重放乐音,控制电子乐器设备,以及各种电子乐器之间传送数据的通信协议。 90、MIDI音频可将电子琴键盘上的弹奏信息记录下来,包括键名、力度、时间长短等,是对乐铺的一种数字描述。
91、MIDI应用:贝音2.0(简谱版)、MidiNotate、天才音乐家音乐创作工具程序、CuteMIDI简谱作曲家、Cakewalk(Sonar)作曲软件
92、三基色原理:自然界常见的各种颜色的光都可以由红、绿、蓝三种颜色的光按不同的比例混合而成,同样,各种颜色的光也可以分解成红、绿、蓝三种颜色。
93、色彩可用亮度、色调、饱和度三个特性来综合描述。 94、亮度是指彩色光作用于人眼时所引起的明亮程度的感觉,与光源能量或与被观察物体的发光强度有关。
95、色调也成色相,是指色彩的相貌和特征。 96、饱和度是指色调深浅的程度。
97、色调与饱和度合称为色度,它既说明了彩色光的颜色类别,又说明了颜色的深浅程度。色度再加上亮度,就能对颜色做完整的说明。
98、色彩模式是指同一属性下的不同颜色的集合。RGB模式用于数码设计,CMYK模式用于出版印刷。
99、色彩模式:RGB模式,CMYK模式,Lab模式,灰度模式,索引模式。 100、图像的基本属性有:
(1)分辨率:三种形式:显示分辨率,图像分辨率,像素分辨率
(2)像素深度:像素深度也称位深度或颜色深度,它描述位图中每个像素点所占的二进制位数,它决定了彩色图像中可以出现的最多颜色数,或者灰度图像中的最大灰度等级数。 (3)颜色类型(了解):真彩色和伪彩色。
(4)位图文件大小:设图像的垂直方向分辨率为h像素,水平方向分辨率为w像素,图像深度为c位,则该图像所需数据空间大小B可按下面的公式计算: B=(h×w×c)÷8
例:一幅分辨率为640×480的二值图像(图像深度为1),其大小是多少? B=(640×480×1)÷8=38400(B)
一幅同样大小的图像,若显示256色,即图像深度为8位(28=256),则: B=(640×480×8)÷8=307200(B)
101、常用位图图像文件格式:BMP,PCX,TIFF,GIF,JPEG,PSD,PNG
102、位图图像的特点:
(1)位图是由像素所构成的图像,文件较大,处理高质量彩色图像时对硬件平台要求也较高。
(2)由于像素之间没有内在联系而且它的分辨率是固定的,因此位图缺乏灵活性。 (3)位图表达的图像逼真、表现力强,能够制作出颜色和色调变化丰富的图像,可以逼真地表现出自然界的景观。
(4)位图数据量大,通常用于表现自然景观、人物、动物、植物和一切引起人类视觉感受
的事物。
103、常用矢量图的文件格式:DXF、CDR、DWG、WMF、EMF 104、图像获取技术(了解):软件屏幕截图:用键盘抓图:Print Screen—将当前屏幕上的内容复制到剪贴板,Alt+Print Screen—将当前屏幕上的活动窗口复制到剪贴板、使用专门的抓图软件。
105、数码相机的工作原理:CCD作为成像部件,把进入镜头照射于CCD上的光信号转化为电信号,再经A/D转换器处理成数字信息,并把数字图像数据存储在数码相机内的存储器中。
106、白平衡:在不同的光照情况下,人眼看同一张白纸会有不同的色彩感,白平衡设置就是把这种色彩感降低到最低。
107、ISO值:ISO感光度是衡量传统相机使用照片感光速度标准的国际统一指标,其反映了胶片感光时的速度。
108、光圈:光圈的大小是相机镜头中控制光线的参数。其大小直接决定了相机镜头的透光量,对曝光有决定性的影响。
109、快门:快门的速度是拍摄照片时控制曝光时间长短的参数。 110、一张照片的曝光度由光圈大小、快门速度、ISO感光度决定。
111、获取图像方法:通过互联网获取图像、使用扫描仪获取图像。
112、视频是多幅静止图像(图像帧)与连续的音频信息在时间轴上同步运动的混合媒体,多帧图像随时间变化而产生运动感,因此视频也被称为运动图像。
113、心理视觉研究表明,如果场频大于50Hz,那么人眼就感觉不到闪烁了。 114、模拟信号主要包括亮度信号、色度信号、复合同步信号和伴音信号。
115、信号的几种类型:复合视频信号、分量视频信号、分离视频信号、射频信号。 116、数字视频的特点:(1)以离散的数字信号形式记录视频信息; (2)用逐行扫描方式在输入设备上还原图像 (3)用数字化设备编辑处理 (4)通过数字化宽带网络传播 (5)可存储在数字存储媒体上
117、动态图像由不断变化的静态图像形成,一幅静态的图像称为一帧。
118、帧频是指每秒钟扫描的帧数。每秒钟扫描的场数称为场频,每秒钟扫描的行数称为行频。
119、电视的分辨率即清晰度,包括垂直和水平两个方向 120、水平分辨率:水平扫描线所能分辨出的点数。
121、垂直分辨率:垂直扫描的行数。
122、电视制式:NTSC、PAL、SECAM。NTSC:美国、加拿大等西半球国家,台湾、日本、韩国、菲律宾使用。SECAM:法国、东欧、中东地带。
123、电视数字化方法:先分离后数字化、先数字化后分离。
124、用Y:U:V表示YUV三分量的采样比例,数字视频采样格式有四种: (1)Y:U:V=4:4:4 (2)Y:U:V=4:2:2 (3)Y:U:V=4:1:1 (4)Y:U:V=4:2:0
125、PAL制式的采样帧频率是25帧/秒,NTSC制式的文件采样帧频率是29.97帧/秒。 126、数字视频的质量用视频分辨率、图像深度、帧率、压缩质量表示。 127、图像深度:视频的图像深度决定了其可以显示的颜色数
128、帧率:每秒的帧数
129、压缩质量:不同的压缩算法产生不同的视频播放质量 130、国际上的数字电视标准:欧洲的DVB、美国的ATSC、日本的ISDB。以DVB和ATSC为主。
131、MPEG-1标准包含:系统部分,用于对整个系统的功能和规范进行规定;视频部分,视频压缩算法及其规范;音频部分,视频压缩算法及其规范。 132、MPEG-1视频的编码方式是按照层次结构安排的:
(1)图片序列是顶层,由一个标题和一些图片组组成。
(2)图片组是随机存取点,即序列中可以独立解码的最小编码单位,它由一个标题和一些图片组成。
(3)图片对应于运动视频的一帧,图片按编码方式分为三种类型:I图片,不参考其他图片而独立编码;P图片,用相对与其他图片的I或P图片的运动补偿进行编码;B图片,双向预测编码图片,用相对于前面或后面的I或P图片的运动补偿进行编码。 (4)宏块是运动补偿和量化尺度变化的基本单位。
(5)块是基本编码单位,DCT作用于每一块。 133、常见的视频文件格式(了解):AVI、MPEG、MOV、WMV、RM、RMVB
134、视频素材采集途径:
(1)首先,数字视频资源可以从现成的数字视频库中截取。包括从已有的视频文件中截取和从网站上下载。
(2)第二,利用计算机软件制作视频。比较常见的就是利用Flash软件制作二维动画和利用3ds max制作三维动画
(3)第三,通过数字摄像机直接记录成数字文件格式,然后存储到硬盘或者光盘之中。 (4)另外,还可以通过一些重要的设备和技术来实现从模拟视频到数字视频信号的转化,这个过程称为视频数字化。