语音压缩、存储与回放 王哲 09211114
洲和我国使用A律,两种算法都使用了非线性的量化方式,把量化间隔变换成人耳能检测的线性空间。
其中A律将归一化后的幅度,正负分别分为了8段。如下图所示其中第1段、第2段斜率相同,因而下图的完整版(包含中心对称的正幅值和负幅值部分)常被称为A律13折线。每一段内,再均匀等分为16个量级。因此,总共的量化级数就由原先的215变为2×8×16=28,即256级。在图中也可以直观的看到,其量化间隔在信号幅度小时较信号幅度大时密集许多。同时,G..711标准建议编码后码字要进行偶数位翻转,然后进行传输。
A律限制采样值为12+1比特,将压缩后的格式码定义为PSSSQQQQ ,相当于将正负值输入分成8 个区段(0~7) 。其中P 为符号位,0代表正,1代表负;SSS表示3位高位的区段码;QQQQ表示区段内码,区分不同输入的范围值。这种编码方式使压缩、解压缩变得简洁而有效率。下表为输入值与压缩编码间的关系,其中X 为压缩中舍弃的位,输入值越大,被 舍弃的位数就越多,每个输入值有其对应的最高有效位。 其压扩特性的数学表达式如下:
F(x)?sgn(x)A|x|11?lnA|x|1(0?|x|?)?sgn(x)(?|x|?1)1?lnAA1?lnAA
μ率除编码位数不同外,原理与A率相似。
第 4页 共 20 页
语音压缩、存储与回放 王哲 09211114
A率编码表
A率解压缩表
μ率编码表
第 5页 共 20 页
语音压缩、存储与回放 王哲 09211114
μ率解压缩表
(3) G.726原理概述
语音信号的相邻样本之间具有很强的相关性,据统计其自相关系数通常可达0.85以上,故而可知相邻样本之间的差值是远小于量值本身的。DPCM(差分脉冲编码调制)就是通过对相邻样本的差值进行编码的语音编码方法。实现DPCM编码的原理图如下所示:
根据上图可知,编码器对本次样本与上一次译码器的采样值进行差分运算,这既可得到所需的差值,又可避免使用延时器获得上一样本时累计量化造成的误差。上图只显示了一次差分的过程,实际上为了达到更加好的预测效果,实际编码中将与多个相邻样本进行比较,充分利用到语音信号之间的相关性。ADPCM(自适应差分脉冲编码调制)是G.726标准的基本原理。其原理框图如下:
第 6页 共 20 页
语音压缩、存储与回放 王哲 09211114
对比DPCM的原理框图可知,ADPCM的核心思想就是在量化中采用自适应的原理,对量化间隔进行动态调整,使用过去的样本值估算下一个输入样本的预测值,使实际样本值和预测值之间的差值总是最小
四. 硬件平台介绍
1. 系统组成结构
本次设计采用的硬件系统是BJTU-DSP5502实验系统,实验箱内包括BJTU-DSP5502实验板和SEED-XDS510PLUS仿真器以及相关配件。BJTU-DSP5502实验板主要包括:DSP芯片1枚(U1):TMS320VC5502@300MHz,SDRAM 1枚(U5):2M×32bit(8Mbytes) HY57V643220CT,FLASH 1枚(U4):256K×16bit(512Kbytes) SST39VF400A-70,CPLD 1枚(U2):CY37064VP100,通信接口3个:仿真器JTAG接口(J1)、连接到PC机USB接口(J4)和UART接口(J2),信号采集和输出端口:立体音输入接口line-in(J5,直接接电脑的语音输出端口)/麦克风输入接口(J7)/耳机音频输出接口(J6),扩展板接口(J9,J10)等,整个系统板结构框图如图所示:
本次语音压缩、存储和回放设计实验将会重点用到信号采集和输出端口,该端口使用CODEC(语音编译码)芯片AIC23B(A/D、D/A转换器)来实现语音信号的输入/输出,AIC23B通过McBSP多通道缓冲串行口与DSP相连。 2. 主要硬件分析
(1) C5502的特点 ?
? ? ? ? ?
增强型哈佛结构,一个程序总线,三个独立的数据总线 40bit的算术逻辑单元ALU 可寻址的程序空间达1Mx16bit 4Kx16bit片内ROM
16Kx16bit双口片内RAM
片内外设:软件可编程等待状态发生器;片内锁相环时钟发生器;
第 7页 共 20 页
语音压缩、存储与回放 王哲 09211114
? 两个多通道缓冲串口;增强型8bit并行HPI口;两个16bit定时器; ? 10ns的指令执行周期。
(2) McBSP (Multi-channel Buffered Serial Port) :多通道缓冲串
行口。
C5502有两个McBSP,McBSP0和McBSP1,其功能特点有: ? 全双工通信。
? 双缓冲发送、三缓冲接收寄存器,以实现连续数据流发送。 ? 支持多达128通道个的接收和发送。
? 利用DMA, McBSP可脱离CPU控制,直接内存存取单独运行 ? 内置?律和?律硬件压缩和扩展。
(3) MCBSP数据的接收与发送:
数据的接收通过三级缓冲完成,如下图所示:
RRDY状态位置1,表明DRR数据已准备好,可以读数据数据的发送通过两 级缓冲完成,如下图所示:
第 8页 共 20 页