进行一次清/浊音判决,在解码器端也是简单用一个清/浊音开关来表示,这样不能完整地表达语音信号所含的丰富的激励信息。多带的思想来源与MBE算法,采用多带处理可以使得从频域上对激励信号的划分更加精密,合成的激励也更加准确。分带滤波器由5个带通滤波器相加得到,5个带通滤波器均采用6阶的巴特沃斯带通滤波器,滤波后的语音信号经全整流及平滑滤波,进行清/浊音判决器取代了清/浊音开关,用混合的激励取代了简单的二元激励,从而得到了一个与短时谱相应的具有清音和浊音混合成分的激励谱,大大提高了合成语音的质量。
4.2 非周期脉冲
采用混合激励可以减少合成语音中的蜂鸣噪声,但是当要处理的信号基音较高而且有伴有噪声时,通常采用在激励信号中混入较多的低频白噪声以减弱其周期性,但这样会使合成语音听起来有些杂音,在MELP算法中使用一种更有效的处理方法:非周期脉冲。
在编码端将基音周期不是很强的浊音段用非周期标志来标识,这样接收端解码的时候根据非周期性的标志让基音周期在一个区间随机变动来减弱合成语音的周期性,采用这种方法可以很好地模拟那些不稳定的声门脉冲,从而使合成语音更加逼近原始的语音信号。需要说明的是,采用非周期脉冲要基于这种混合激励的算法,如果单纯使用非周期脉冲,可能会使语音质量反而恶化。
4.3 残差谐波处理
在LPC残差信号中含有大量的语音特征,限于码率的原因,以往的低速率LPC算法在生成激励脉冲时,只反映了它的周期性并没有反映它的幅度特性,因而不能很好地反映实际激励脉冲动态变化的特性。近几年来,由于采用了矢量量化和LSP技术,是得线性预测参数的量化比特数比以往大大减少,可以多空出几个比特,在MELP算法中,把这几个比特用于对残差信号的处理。但是用这几个比特很难全面的描绘残差信号的特性,MELP算法借鉴原波形插值(PWI)算法的做法,只能对较重要的特征,如:各基音周期谐波处的傅立叶级数幅度值进行矢量量化。残差信号中对语音影响最大的是低频带,经过对谱波数目和量化误差与合成语音效果之间关系的权衡考虑,2.4kbps的MELP算法对最低10阶谐波进行矢量量化,对10阶以上谐波的傅立叶级数幅度值认为是平坦的,由单位值来代替。对于这样得到的谱,按基音周期进行离散傅立叶反变换,得到周期脉冲激励序列,它比固定的脉冲序列提供了更多的灵活性。对残差谐波谱的传输,在很大程度上提高了合成语音的自然度、清晰度和抗噪声的能力,大大改善了LPC合成语音闷弱、嘶哑和合成语音重等特点。
4.4 自适应谱增强
由于人说话是声道的共振峰带宽即使在一个基音周期内也可能发生变化,并且LPC这种全极点的
模型削弱共振峰的特征,同时还由于量化误差等原因,LPC合成滤波器的极点形状与自然语音的共振峰形状存在偏差,导致了在共振峰之间合成语音的波谷不如原来的语音波谷,使合成语音听起来发闷,为了使合成语音与原始语音在共振峰有更好的匹配,MELP算法引入了自适应谱增强技术。
自适应谱增强通过让激励信号经自适谱增强滤波而实现。自适应谱增强滤波器是由系数自适应变化的阶数等于线性预测阶数的零点滤波器与一阶零极点滤波器级联而成的滤波器组。通过突出激励谱中共振峰频率处的谱密度,可以达到提高整个短时谱在共振峰处的信噪比的目的,这也符合线性预测残差信号中仍包含一定的共振峰形状的特性,其中,极点滤波器的作用是衰减共振峰之间的频率分量,突出共振峰的结构;零点滤波器的作用是补偿对共振峰之间的频率分量的衰减;一阶零极点滤波器的作用是补
偿零极点滤波器引起的频谱倾斜。零极点滤波器的系数均由LPC系数乘以一个相应的自适应比例因子得到。在许多基于共振峰谱包络合成中低速语音编码算法中都采用这种自适应谱增强的技术。其实现原理较为简单,算法的复杂度也不高,对编码端没有额外的要求,是加强低速率语音编码质量的实用技术。
4.5 脉冲整形滤波
进行脉冲整形滤波的目的,是为了让分带合成语音与原始语音在非共振峰区波形上具有更好的匹配。周期性较强的语音,是通过声门的周期性开闭产生声门脉冲激励的声道而产生的。产生实际语音时,这是很复杂的,其主要原因是:人说话是声门开闭不一定很完整,往往除了主要的声门脉冲,还可能在主要脉冲之间出现一些小的二次谐波;声门关闭不完全会造成一些吸气噪声;两次大的激励峰之间由于声道作用的非线性,可能会出现一些背景噪声。以上因素都会造成声门激励脉冲的峰值不集中于时域的一个点上,并且使语音的周期性发生一定的混淆。LPC合成时很难对这些复杂的现象进行准确的模拟,致使合成语音同原始语音相比,在一个周期内的峰-峰值更加尖锐。同时,LPC分析的共振峰带宽比实际应有的要大,会引起某些频带处的谐波信号衰减较大。
为了使合成语音符合原始语音的这一变化情况获得较为自然的语音,应对合成语音的峰-峰值进行平滑。其方法很多,可以在周期激励中引入第二个峰值,或改变周期激励谱的形状,但这些方法可能会破坏原有的激励模型,造成失真。这样,为了保持原有激励模型的优点,MELP算法在语音合成后加一级后处理:脉冲整形滤波。该滤波器是一个FIR滤波器,其系数是通过将典型男性周期脉冲的谱强制变换为平坦谱,再进行傅立叶反变换得到的,它具有减弱某些频带处周期性的作用,降低了基音周期为典型周期附近的峰-峰值,使合成语音的蜂鸣效果降低,变得更为连惯、自然。
5 结束语
语音编码技术一直是一项理论性和实践性都很强的专门技术,尤其是低速率以及超低速率语音编码更是当前语音信号处理领域的一项重要研究课题。本文针对当前的2.4kbps的低速率语音声码器的改进进程展开讨论,由最开始的LPC-10声码器到现在所使用的MELP声码器,无论是在哪个阶段每个声码器都有比较大的改进。
总的来说,MELP声码器是目前低速率语音编码中一种比较理想的编码方案,该算法是对传统线性预测编码参数模型的改进,它结合了混合激励和多带的思想,更好的模拟了自然语言特征,可以在2.4kbls的速率下合成出较高质量的语音。因此MELP算法确实是一个比较优秀的低速率语音压缩编码算法,在今后的实际应用中会有很大的价值。
参考文献:
[1] W. B. Kleijn ,K. K. Paliwal . Speech Coding and Synthesis, Amsterdam [M]. The Netherlamds, Else - vier ,2005 :15~40. [2] A V McCree, T P Barnwell III. Mixed Excitation LPC Vocoder Model for Low Bit Rate Speech Coding[J]. IEEE Trans On Speech and Audio Processing, 2005, 3: 242-250.
[3] 赵晓群主编.数字语音编码[M].北京:机械工业出版社,2007,156~178 [4] 王洪,唐凯主编.低速率语音编码[M].北京:国防工业出版社,2006,54~64 [5] 吴海峰主编.语音编码技术及应用[M].北京:机械工业出版社,2005,98~115 [6] 鲍长春主编.数字语音编码原理[M].西安:西安电子科技大学出版社,2007,296~310
[7] 马震,陈延萍.2.4kbps 混合激励线性预测编码方法研究[J].声学与电子工程,2006(2):28~30
[8] 范晶,和应民,王桂梅.2.4kbps混合激励线性预测语音编码的研究[J].牡丹江师范学院学报,2007(4):13~14