基于语音存在概率的语音活动检测方法(2)

2012-11-01 21:50

  3利用语音存在概率进行VAD

  3.1检测指标计算

估计出语音存在概率后,还不能直接用来进行VAD,因为这些概率是针对每一个频率点的,需要将这些信息转换为某一帧的评价量。通过对语音存在概率随时间和频率点分布的观察,发现有2项指标可被用来比较准确地辨别出有声段和无声段,分别是

  

  其中,pt为某一帧所有频率点的语音存在概率之和,pe为某一帧上语音存在概率为1的所有频率点个数,M为有频率点数。但是,实验表明,这两个参数虽然总体上可以看出哪些是无声段哪些是有声段,但起伏可能非常剧烈,所以需要进行平滑处理。设定

  

  其中,采用了当前帧前面4帧的数据进行平滑。

  3.2参数设定

  判断是否存在语音主要看式(17)~(18)中2个指标是否超过某个门限。具体为

  

  其中,式(19)~(20)对一段含噪信号最开始一段的2个指标求平均,然后利用式(21)~(22)得到正式的门限;W为每帧有频率点数。其判断结果

  

  其中,“1”为有语音,“0”为无语音。

  4实验结果

为  评价该VAD方法的性能,设定如下指标

含噪信号是人工合成的,其中纯净信号来自一段评书,噪声信号取自Noisex-92噪声库,包括白噪声、粉红噪声、F16战斗机噪声、沃尔沃汽车噪声、闲聊声和工厂噪声等,信噪比均为6 dB。所有指标均与文献[3]中的方法对比。含语音帧总数和纯噪声帧总数根据纯净信号人为判定。将文献[3]中的方法称为方法A,本文方法称为方法B。3项指标的计算结果列于表1~3。

可看出,在大部分情况下,方法B要优于方法A;但当信噪比降低到一定程度后,方法A要优于方法B。图1给出了背景噪声是白噪声时,2种方法的性能比较。可看出,当输入信噪比大于5 dB时,方法B明显优于方法A;但当信噪比降到0 dB后,方法A好于方法B。

  5总结

这  种新的VAD方法在信噪较高时,效果非常好。如实验发现,当背景噪声为白噪声,信噪比为18 dB时总体准确率可达0.961 8,而文献[3]中的方法只能达到0.831 3。但当信噪比下降到0 dB后,新的方法表现不如文献[3]中的方法。另外,在背景噪声为非平稳噪声时,效果也不够理想,有待改进。

  参考文献

  [1]MARTIN R.Noise power spectral density estimation basedon optimal smoothing and minimum statistic    [J].IEEETrans.on Speech and Audio Processing,2001,9(5):504-512.

[2]COHEN I.Noise spectrum estimation in adverse environment:improved minima controlled recursive averaging[J].IEEE Trans.on Speech and Audio Processing,2003,11(5):466-475.

[3]吴平,谷源涛,崔慧娟.一种稳健的背景噪声监测方法[J].电声技术,2003(11):42-45.


基于语音存在概率的语音活动检测方法(2).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:浅析注水井套损原因及预防治理

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: