◆YUV 表示法的重要性是亮度信号Y 和色差信号(U 、V )是相互独立的,其优点是可利用人眼的特性来降低数字彩色图像所需要的存储容量
◆数据压缩的目的:尽可能地消除数据的冗余,便于数据存储和运输 ◆冗余分类:统计冗余、信息熵冗余、结构冗余、知识冗余、视觉冗余 ◆图像数据压缩的算法:信息熵编码、通用编码、预测编码、模型编码、矢量量化编码、子带编码、混合编码
◆压缩算法的指标包括:压缩比、算法的复杂性和运算速度、失真度、无损编码、有损编码 ◆变换编码:是将时域信号变换到频域信号上进行处理的方法。
◆矢量图:是用数学的方法描述的一系列点、线、弧和其他几何形状 ◆位图映像图(光栅图),由像素组成
◆位图映像图图形文件常见的格式:BMP 、GIF 、PNG
◆BMP 图像文件由三部分组成:位图文件头数据结构、位图信息数据结构、位图阵列
◆PNG 图像的缺点:文件格式不支持动应用;PNG 不支持CMYK 的模式、 ◆静态图像压缩标准 JPEG 标准
◆JPEG 标准规定了两种工作方式:顺序方式和渐进方式;且具有3种级别编码算法:基本系统、扩展系统、无真系统。基本系统编码算法以离散余弦变换(DCT )为核心。
◆JPEG 基本系统算法过程:通过离散余弦变换减少图像数据的相关性;利用人眼视觉特性对系数进行自适应量化;对每个子块量化后的系数矩阵进行Z 形扫描,将悉数矩阵变换成符号序列;用哈夫曼变长码对符号进行熵编码。
◆JPEG 2000标准算法核心:采用以离散小波变换算法(DWT )为主的多解析编码方式
◆JPEG 2000优势:高压缩率;无损压缩;渐进传输;感兴趣区域压缩。 ◆动态图像压缩标准:MPEG 标准(减少空间冗余) ◆MPEG-4主要应用于可是电话、视频邮件、电子新闻
◆MPEG-4最重要的三个技术特征:基于内容的压缩、更高的压缩比、时空可伸缩性
◆MPEG-4与MPEG-1和 MPEG-2不同之处在于:MPEG-1和 MPEG-2是基于帧的规则,而 MPEG-4是基于媒体对象的规范
◆MPEG-4将数字电视最终完全取代现有的模拟电视 ◆H.261标准适用于综合业务数字网(ISDN ) ◆H.263标准适用于公共交换电话网(PSTN ) ◆H.263目的是能在现有的电话网上传输活动图像
◆半像素运动补偿:指半像素为一点像素值由相邻点整像素位置的值进行双线性内插得到
◆H.264标准的关键技术:分层设计;高精度、多模式运动估计;4*4块的整数变换;同统一的VCL ;帧内预测;面向IP 和无线环境
★声音的三要素:音调、音强、音色 音强也称响度,用来描述声音的强弱,取决于声音的幅度 ★音频信号压缩技术:无损压缩、有损压缩
★均匀量化(线性量化):采用相等的量化间隔对采样得到的信号进行量化
★非均匀量化(非线向量化)基本思想:对输入信号进行量化时,大的输入信号采用大的量化间隔,晓得输入信号采用小的量化间隔。
★音频信号处理的方法:采样、量化
★. 数字语音通信语音质量分4类,广播质量、网络质量、通信质量、合成质量
★自适应差分脉冲编码调制ADPCM 的思想是:1. 利用自适应的思想改变量化的大小,即使用小的量化增量去编码小的差值,使用大的量化增量去编码打的差值;2. 使用过去的样本值估算下一个输入样本的预测值,使实际样本值和预测值之间的差值总是最小。
★MIDI 是数字音乐电子合成音乐的统一国际标准,其目的是解决各种电子乐器间存在的兼容性问题。 ★MIDI 定义的内容:定义了计算机音乐程序、音乐合成器及其他电子音乐设备交换音乐信号的方式 ★声卡的声道:1. 单声道:比较原始的声音复制形式;2. 立体声:声音在录制时被分配到两个独立的声道;3. 四声道环绕声:其四个发音点位前左前、右后、左后、右及附加低音单元。
★声卡的功能:1. 录制、编辑和回放数字声音文件;2. 控制各声源的音量,并混合在一起,一遍数字化;3. 在记录和回放数字文件时进行压缩和解压缩,以节省存储空间;4. 采用语音合成技术,能够让计算机朗读文件;5.MIDI 接口
★语音合成技术及应用:语音识别和语音合成技术时实现人和计算机进行语音通信所必须的关键技术。语音合成:包含两个可能性:一是机器能再生一个预先存入的语音信号,就像录音机只是采用数字技术;一种是采用数字信号处理方法。
★语音合成的三个层次:按人类语言功能的不同层次可分三个层次:1. 从文字到语音的合成;2. 从概念到语音的合成;3. 从意向到语音的合成。
★语音合成技术的应用:1.人机对话;2. 电话咨询;3. 自动播音;4. 助讲助读;5. 语音教学;6. 电话翻印。 ★语音识别技术主要包括:特征提取技术、模式匹配准则、模型训练技术三个,另外还涉及到语音识别单元的选取。
★语音识别系统的类型:按对说话人的依赖程度可以分特定人非特定人语音识别系统;按对话人说话方式可以分孤立字词语、连接词、连续语音识别系统。按词汇量大小可分小词汇量、中等词汇量、大词汇量和无限词汇量语音识别系统。
★语音识别的应用:1.语音邮件的集成;2. 数据库的输入和询问应用;3. 语音命令和控制应用。
◆技术皮书说明:红皮书---CD-DA 黄皮书---CD-ROM 绿皮书---CD-I 橙皮书---CD-R 白
皮书---Video CD红皮书+CD-Bridge---Photo CD 蓝皮书---LD ◆CD 盘的结构:主要由保护层、反射激光的铝制反射层、刻槽和聚碳酸酯衬垫组成。
◆CD-ROM 驱动器工作原理:光驱常见部件有光盘托盘、托盘开关、耳机孔、和音量控制按钮。其背面有四孔电源线,一条数据传输线和一条链接到声卡的线。光驱三种数据接口:一是早期的AT bus接口,二是主流的IDE 接口,三是SCSI 接口
◆DVD 提高容量的两种方法:一种是减少光道距离和凹坑尺寸;一种是增加数据记录层的层数。 ◆DVD 视频编码技术:采用MPEG-2压缩技术。
★多媒体软件的主要任务:是使用户能够方便、有效地组织和调整多媒体数据,让多媒体硬件去处理相应的媒体数据,实现音频、视频同步,真正实现多媒体的信息表达方式 。
★多媒体软件分为5类:驱动程序、支持多媒体的操作系统或环境、多媒体数据库准备软件、多媒体编辑创作软件和多媒体应用软件。
★多媒体驱动程序及其作用: 多媒体系统中直接和硬件打交道的软件称为设备驱动程序,它完成设
备的初始化、设备各种操作以及基于硬件的压缩和解压缩、图像快速变换等基本硬件功能调用。 ★多媒体操作系统在驱动软件之上,是多媒体软件的核心,其主要任务和特征如下:负责多媒体环境下多任务的调度; 保证音频、视频同步控制以及信息处理的实时性; 提供多媒体信息的各种基本操作管理; 具有对设备的相对独立性与可扩展性。
★多媒体创作工具:多媒体数据库和创作工具为多媒体应用提供资源和信息加工,如声音录制、编辑、视频采集、剪接、动画生成和网页制作等。
★多媒体创作工具的评测标准:1. 编程环境;2. 各种媒体数据输入能力;3. 动画制作与演播;4. 应用程序间的动态链接;5. 制作片段的模块和面向对象化;6. 易学习、已使用;7. 多媒体创作工具应设计成操作简便、编辑时易于修改,所见即所得,菜单和工具布局合理,使用户掌握了基本的操作技能后,能尽快地进行工作;8. 良好的扩充性。
★音频数据处理软件是为多媒体计算机应用录制、编辑、修改数字化声音的工具软件。通常以“wav ”为扩展名,称为W A V 格式文件。
★一个完整的数字化声音处理软件应包括如下功能:音频数据的录制;音频数据的编辑和回访;音频数据的参数修改;效果处理;图形化的工作界面;非破坏式修改;能以W A V 格式文件存储数字化声音数据。
★流式技术:是指将音频文件和视频文件变换为若干个数据小包,在网上像流水一样传送。
★多媒体应用软件有以下几种:1. 各种信息管理软件;2. 办公自动化系统;3. 各种文字处理软件;4. 各种辅助设计软件以及辅助教学软件;5. 各种软件包。