语音质量(MOS)专题分析报告(2)

2019-08-31 19:45

要体现在录音文件的处理上。

1S静音6S波形1S静音样本文件

鼎利算法:原始波形是64000帧波形,从放音开始计算对比每一个帧,直到64000个帧结束。最终得出PESQ、LQ、MOS等分值。

华星算法:在PESQ评分时,华星软件直接把标准样本和退化样本进行对比,获得PESQ、LQ、MOS等分值。

由上面3张图可以看出:

A. 鼎利公司的录音文件是一个不在录制范围内的t时间声音文件+(8-t)s的样本文件。 B. 华星公司的录音文件是一个不在录制范围内的t时间声音文件+8s的样本文件+200ms保护。 从保持录音文件的完整性来说,我觉得应该使用华星的方式。

3.3 各厂家输出MOS分值的公式不同

华星最后输出的结果为PESQ值,鼎利的人工测试输出结果为PESQ-MOS,鼎利自动路测输出结果为

PESQ-LQ值。

华星回复:2005年中国移动在引入语音质量评估时,华星根据国际电联P.862标准,选择了PESQ Score作为语音质量评分指标。

1、 华星MOS盒CDMA语音线路经过两次耳机插孔。

MOS盒在2010年8月20日星期五完成改造,并在菜市口机楼小会议室进行了试测。试测结果为PESQ值,如下表所示: 话音质量 改造前 改造后 >3.5比例 19 16.52% 73 31.20% 3.3-3.5 77 66.96% 128 54.70% 3.1-3.3 15 13.04% 20 8.55% 2.9-3.1 3 2.61% 11 4.70% 2.7-2.9 1 0.87% 1 0.43% 2.5-2.7 2.3-2.5 0 0.00% 1 0.43% 0 0.00% 0 0.00% 2-2.3 0 <2 0 平均值 3.397 3.414 0.00% 0.00% 0 0 0.00% 0.00% 改造前105.00?.00?.00u.00e.00U.00E.005.00%.00.00%>3.5>3.3>3.1>2.9>2.7改造后>2.5>2.3>2all

话音质量 改造前 改造后 >3.5 16.52% 31.20% >3.3 >3.1 >2.9 >2.7 >2.5 >2.3 >2 all 83.48% 96.52% 99.13% 100.00% 100.00% 100.00% 100.00% 100.00% 85.90% 94.45% 99.15% 99.58% 100.00% 100.00% 100.00% 100.00% 从两次测试分值的分布可以看出,改造后的PESQ分值还是有一定的提升。由于CDMA手机大部分手机只有插孔式耳机,后期准备找一款耳机线内置于数据线接口的手机进行改造试验。

3.4 使用语音样本格式不同

华星使用的是样本文件A-law编码的16bit的8000Hz的PCM格式音频文件

华星回复:华星软件实际支持PCM和WAV两种文件格式。,华星认为PCM文件和WAV文件本身是一样的,只是WAV文件的文件头中会有编码格式的信息,而PCM不包含此信息。

选择这个编码的原因是考虑到在目前电信网的中继传输中,大部分情况下会将手机发送到基站的语音编码为A-law格式进行传输,在源文件使用A-law编码可以在一定程度上抵消中继传输中编码原因引起的PESQ分值下降。

下表是一次定点GSM测试中使用WAV和PCM文件的评分结果: 使用文件格式 PCM文件一 WAV文件一 PCM文件二 WAV文件二 PESQ 3.929 3.924 2.853 2.846 PESQ_LQ 4.049 4.043 2.511 2.501 PESQ_LQO 4.081 4.076 2.607 2.598 从上表可以看出,使用PCM格式文件比用WAV格式文件打分值要偏高,但是偏差幅度为0.00X。 解决措施:为了更好的贴近用户感知,所有样本统一为A-law编码的16bit的8000Hz的WAV格式音频文件。

3.5 P.862 P.862.1 P.862.2与P.862.3的关系

P.862是ITU-T定义的是PESQ算法作为一种客观评价语音网络传输质量的标准。 P.862.1则是定义了从PESQ推算PESQ_LQO作为到MOS分值映射的公式。

P.862.2定义了在宽带语音(8KHz)系统中使用PESQ算法和从PESQ推算PESQ_LQO作为到MOS分值映射的公式。 P.862.3则是ITU-T关于如何合理使用PESQ方法进行语音评估的建议。

从历次规范演进来看,P862.1已经完成了基于窄带语音评估的PESQ值到MOS值的映射,目前最贴近GSM/CDMA2000网络承载语音业务的话音质量人耳体验值是PESQ_LQO值(即PESQ MOS)值。

3.6 PESQ score与PESQ_LQ以及PESQ-MOS分值关系

PESQ有四种质量分值,即根据P.862计算的pesq_score分值、根据类MOS尺度的PESQ-LQ分值、根据评估模型计算的损耗因子PESQ-Ie,映射到主观评估的MOS值。其中PESQ-LQ和PESQ-Ie都是根据pesq_score分值采用简单的公式转换得来得,PESQ-LQ值是根据心里声学来计算的,而PESQ-Ie是根据ITU-T P.834得到的

在同样差的话音质量条件下,pesq_score分值要比主观的MOS值大。心里声学通过大量的主观测试数据来进行分析。为了更好地将PESQ和传统的MOS值联系起来,我们引入了PESQ-LQ 的概念。根据ITU-T P.800的介绍,PESQ-LQ更接近人的主观听觉质量。MOS值一般在1到5之间,而PESQ-LQ的分值在1到4.5之间。在主观测试中,PESQ-LQ的最大值为4.5。

3.7 CDMA MOS分值较低的原因 3.7.1 ITU-T P862系列的规范有分歧:

ITU-T P.862发布于2001年2月,其中对适用范围的有如下表格: Table 1/P.862 ???Factors for which PESQ had demonstrated acceptable accuracy Test factors Speech input levels to a codec Transmission channel errors Packet loss and packet loss concealment with CELP codecs Bit rates if a codec has more than one bit-rate mode Transcodings Environmental noise at the sending side (See Note.) Effect of varying delay in listening only tests Short-term time warping of audio signal Long-term time warping of audio signal Coding technologies Waveform codecs, e.g. G.711; G.726; G.727 CELP and hybrid codecs ≥4 kbit/s, e.g. G.728, G.729, G.723.1 Other codecs: GSM-FR, GSM-HR, GSM-EFR, GSM-AMR, CDMA-EVRC, TDMA-ACELP, TDMA-VSELP, TETRA ITU-T P.862规范规定PESQ算法是可以用于不同制式网络之间的话音质量评估的。

ITU-T P.862.3发布于2007年11月。3GPP2组织过对EVRC编码方式和GSM-AMR编码方式的MOS对比测试,与PESQ的分值相比,QualComm公司认为PESQ算法对与EVRC族编码方式评分总体偏低。对此,ITU-T在P.862.3(2007/11)中予以声明,不建议在对比使用EVRC编码的网络(如CDMA)和其他网络(如GSM/WCDMA/TD-SCDMA)时直接使用P.862得分(包括PESQ,PESQ LQ,P.862.1,P.862.2)进行对比,对于使用EVRC编码的网络,P.862得分直接对比仅适用于对相同制式网络的比较。以下为规范内原文

Conclusions:

1) The direct comparison of P.862.1/P.862.2 scores obtained with AMR-type codecs or other ITU-T speech codecs with the EVRC family of codecs is not recommended. This includes the

benchmarking between GSM/UMTS networks and CDMA networks which are usually equipped with EVRC family codecs.

2) The comparison of different conditions (e.g., bit rates, error patterns) using EVRC is possible by P.862.1/P.862.2 due to the correct relative ranking of the quality scores within those conditions. Consequently, P.862.1/P.862.2 might be usable for benchmarking of CDMA networks to each other or for optimization efforts within those networks if the same codec is involved. The direct comparison of P.862.1/P.862.2 scores with P.800 subjective listening scores is not appropriate for the EVRC family codecs。

根据了解到的情况,该核心算法的拥有者推出了PESQ算法的HD版本,可以解决上述问题。

3.7.3 MOS盒硬件实现方式不同

MOS盒测试CDMA差别大,其中华星MOS盒原因为MOS到手机两端均为耳塞插孔,失真较大;而鼎利MOS盒在CDMAMOS评估的时候采用模块化的设计,失真较少。

3.7.3 CDMA MOS测试使用终端的不同

在MOS盒相同的情况下,使用三星手机和LG CDMA手机所测试MOS分值相差较大,平均相差0.4分。


语音质量(MOS)专题分析报告(2).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:水淹厂房事故处置方案(模版)

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: