DPCM又是建立在脉冲编码调制(PCM)的基础上。
PCM是将连续的模拟信源离散成数字化信源的一种基本手段。PCM可分为3个基本步骤:取样、量化与编码。以语音信号为例,单路连续模拟信号带宽为300~3400Hz,标准带宽取4kHz,取最高频率的2倍,则取样率为8kHz,量化与编码时按非线性(A律或μ律)量化的8比特考虑,则单路模拟语音信号量化后速率应为8×8=64Kbps。 DPCM不直接传送PCM数字化信号,而改为传送其取样值与预测值(通过前面样点值经线性预测求得的)的差值,并将其量化、编码后传送。由于经过预测和差值以后,其样值差值(误差值)的信息熵要小于直接传送样值的信息熵,且在相同量化噪声要求的条件下,显然DPCM量化后的比特数要小于PCM的量化比特数,从而达到压缩信源码率的作用。
ADPCM与DPCM原理是一样的。两者之间主要差别在于ADPCM中的量化器和预测器引入了自适应控制机制。同时在译码器中多加
上一个同步编码调整器,其作用是为了在同步级联时不产生误差积累。20世纪80年代以来,32KbpsADPCM技术日趋成熟,其质量与PCM已相差无几,但速率却节省了一半,即从PCM的64Kbps降为ADPCM的32Kbps。
32Kbps ADPCM编码原理如图4.1所示。
图4.1 32Kbps ADPCM编码原理图 图4.1中,编码器输入信号为PCM码c′(n),它经过PCM/线性码转换,将8bit非线性PCM码转换成12位线性码x(n),16电平的自适应量化器把差值信号d(n)转化为4位二进制码c(n),为了使量化器适应不同统计特性的输入信号,根据输入信号的性质可以改变自适应速度参数来控制量化阶距大小。这一电路是由定标因子自适应和自适应
速度控制两部分电路来实现的。
32Kbps ADPCM译码原理如图4.2所示。
图4.2 32Kbps ADPCM译码原理图 译码器的结构大部分与编码器电路相同,只是多了一个同步编码调整电路,其作用是为使同步级联工作时不产生误差累积。 2.参量编码的基本原理
参量编码不直接传送语音波形,而是传送产生、激励语音波形的基本参量。决定语音波形的方式很多,其中最常用的是人工合成语音(声码器)的线性预测方式,它是移动通信的语音混合编码器的最基本依据,这里将重点介绍。
根据语音产生机理,采用下列物理模型是基本合理的,如图4.3所示。
图4.3语音产生物理模型
图4.3中,周期性信号源近似表示浊音信号源,随机性信号源近似表示清音的信号激励,根据瞬时语音信号种类以决定采用哪一种激励源。人的喉部声道特性及嘴唇边界条件等都可以近似看成一个时变线性系统,频域上是一个时变滤波器,图中u(n)表示波形产生的激励参量,G为语音增益,C(n)为人工合成语音。根据发音器官的惯性限制,时变特性为慢变化,大约几十毫秒(ms)内可以认为是近似不变的,它是传送时变参量周期的重要依据。
典型参量编码的线性预测LPC方案如图4.4所示。
图4.4线性预测LPC编译码方案 在发送端一般需要提取并传送15个基本参量:基因周期P、清浊音判决U/V、语音增益G及12个线性时变合成语音滤波器系数{ai},i=1,2,?,12。在具体处理时,首先对每帧(10~20ms)语音进行分析并提取这15个参量,然后经过量化、编码再送至信道。在接收端,首先要通过参量译码恢复这15个基本参量,其次再按照发声的物理模型,利用这些参数激励并合成人工语音。
在上述LPC的基本结构中,若采用直接传送方式,15个基本参量量化后大约需要7.2Kbps。即12个预测系数{ai},i=1,2,?,