基音周期检测算法比较(2)

2020-02-21 11:18

安徽财经大学管理科学与工程学院本科毕业论文

基因周期作为语音信号处理中描述激励源的重要参数之一,在语音合成、语音压缩编码、语音识别和说话人确认等领域都有着广泛而重要的问题,尤其对汉语更是如此。汉语是一种有调语言,而基因周期的变化称为声调,声调对于汉语语音的理解极为重要。因为在汉语的相互交谈中,不但要凭借不同的元音、辅音来辨别这些字词的意义,还需要从不同的声调来区别它,也就是说声调具有辨义作用;另外,汉语中存在着多音字现象,同一个字的不同的语气或不同的词义下具有不同的声调。因此准确可靠地进行基音检测对汉语语音信号的处理显得尤为重要。

1.3 基音检测的研究现状

自进行语音信号分析研究以来,基音检测一直是一个重点研究的课题。尽管目前基音检测的方法有很多种,然而这些方法都有其局限性。迄今为止仍然没有一种检测方法能够适用不同的说话人、不同的要求和环境、究其原因,可归纳为如下几个方面[5]。

1.语音信号变化十分复杂,声门激励的波形并不是完全的周期脉冲串,在语音的头、尾部并不具有声带振动那样的周期性,对于有些清浊音的过度帧很难判定其应属于周期性或非周期性,从而也就无法估计出基音周期。

2.声道共振峰有时会严重影响激励信号的谐波结构,使得想要从语音信号中去除声道影响,直接取出仅和声带振动有关的声源信息并不容易。

3.在浊音语音段很难对每个基因周期的开始和结束位置进行精确的判断,一方面因为语音信号本身是准周期的。另一方面因为语音信号的波形受共振峰、噪音等因素的影响。

4.在实际应用中,语音信号常常混有噪声,而噪声的存在对于基音检测算法的性能产生强烈影响。

5.基音频率变化范围大,从低音男声的70Hz到儿童女性的450Hz,接近3个倍频程,给基因检测带来了一定的困难。

尽管语音检测面临着很多困难,然而由于基因周期在语音信号处理领域的重要性,使得语音基因周期检测一直是不断研究改进的重要课题之一。数十年来,国内外众多学者对如何准确地从语音波形中提取出基因周期作出了不懈的努力,提出了多种有效的基音周期检测方法。我国基因检测方面的研究起步要比国外发达国家晚一点,但是进步很大,特别是对汉语的基音检测取得成果尤为突出。目

2

安徽财经大学管理科学与工程学院本科毕业论文

前的基因检测算法大致可分为两大类:非基于事件检测方法和基于事件检测方法

[6]

,这里的事件是指声门闭合。

非基于事件的检测方法主要有:自相关函数法[7-10]、平均幅度查函数法[11],倒

谱法[12][13],以及在以上算法基础上的一些改进算法[14-17]。语音信号是一种典型的时变、非平稳信号,但是,由于语音的形成过程是发音器官的运动密切相关的,而这种物理运动比起声音振动速度来讲要缓慢得多,因此语音信号常常可假定为短时平稳的,即在短时间内,其频谱特性和某些物理特征参量可近似地看作是不变的,非基于事件的检测方法正是利用语音信号短时平稳性这一特点,先将语音信号分为长度一定的语音帧,然而对每一帧语音求基音周期。相比基于事件的基音周期检测方法来说,它的优点是算法简单,运算量小,然而从本质上说这些方法无法检测帧内基因周期的非平稳变化,检测精度不高。

基于事件的检测方法是通过定位声门闭合时刻来对基因周期进行估计,而不需要对语音信号进行短时平稳假设,主要有小波变换方法和Hilbert-Huang变换方法两种。在时域和频域上这两种方法又具有良好的局部特性,能够跟踪基因周期的变化,并可以将微小的基因周期变化检测出来,因此检测精度较高,但是计算量较大。

1.4 论文的结构安排

与论文的主要内容相对应,全文具体章节安排如下:

第1章:首先简述语音信号处理以及基因周期检测的相关概念,其次对基音检测的背景研究意义、意义以及现状进行了说明,最后叙述了论文的结构安排。

第2章:对对现有的基音检测算法进行归纳和总结,针对常用的两种检测算法,详细介绍其检测原理以及事先,并进行了优缺点分析。

第3章:在matlab上对自相关函数法和平均幅度差函数法进行了实现,对语音信号滤波前后的基音周期轨迹图进行了比较。

第4章:对论文的主要内容进行了总结,对语音基因周期的检测算法进行了很好的展望。

最后是参考文献、致谢、附录。

3

安徽财经大学管理科学与工程学院本科毕业论文

第2章 基音检测的常用算法

2.1 引言

基音周期是语音信号的重要参数之一,准确而快速基音周期检测对语音信号的合成、编码、识别等具有重要意义。目前,基音检测的算法有很多种,常用的检测算法要有自相关函数法、平均幅度差函数法等。本章将详细的介绍这两种常用基音检测算法的基本原理。

2.2 常用的基音检测算法及原理

2.2.1 自相关函数法

能量有限的语音信号?s(n)?的短时自相关函数[10][11]定义为:

Rn(?)?N?1??m?0?[s(n?m)w(m)][s(n?m??)w(m??)] (2.1)

其中,?为移位距离,w(m)是偶对称的窗函数。 短时自相关函数有以下重要性质:

①如果?s(n)?是周期信号,周期是P,则R(?)也是周期信号,且周期相同,即R(?)?R(P??)。

②当τ=0时,自相关函数具有最大值;当??0,?P,?2P,?3P?处周期信号的自相关函数达到极大值。

③自相关函数是偶函数,即R(?)?R(??)。

短时自相关函数法基音检测的主要原理是利用短时自相关函数的第二条性质,通过比较原始信号和它移位后的信号之间的类似性来确定基音周期,如果移位距离等于基音周期,那么,两个信号具有最大类似性。

在实际采用短时自相关函数法进行基音检测时,使用一个窗函数,窗不动,语音信号移动,这是经典的短时自相关函数法。窗口长度N的选择至少要大于基音周期的两倍,N越大,短时自相关函数波形的细节就越清楚,更有利于基音检测,但计算量较大,近年来由于高速数字信号处理器(DSP)的使用,从而使得这一算法简单有效,而不再采用结构复杂的快速傅里叶变换法、递归计算法等;N越小,误差越大,但计算量较小。

4

安徽财经大学管理科学与工程学院本科毕业论文

图2-1 (a)原信号(b)自相关函数

图2-2 (a)原信号(b)自相关函数

基于自相关函数的算法是基音周期估计的常用方法,特别适用于噪声环境下的基音提取。自相关函数在基音周期处表现为峰值,相邻两个峰值之间的间隔即为一个基音周期。但通常情况下,基波分量往往不是最强的分量,丰富的谐波成分使语音信号的波形变得非常复杂,给基音检测带来了困难,经常发生基频估计

5

安徽财经大学管理科学与工程学院本科毕业论文

结果为其实际基音频率的二次倍频或二次分频的情况。加之还有清浊混杂等情况,使基音检测成为一大难题。

如图2-1(a)是一帧语音信号,2-1(b)是这帧语音信号的自相关函数,可以看出自相关函数在基音周期处表现为峰值,这些峰值点之间的间隔的平均值就是基音周期,如图2-2(b)所示可以看出自相关函数检测出的基音周期是原始信号基音周期的一半,这是由于谐波峰值点(箭头所示)的影响,这就是上述缺点中所说的倍频现象。

2.2.2 平均幅度差函数法

语音信号?s(n)?的短时平均幅度差函数[12][13]定义为:

1N?1Fn(?)??s(n?m)w1(m)?s(n?m??)w2(m??) (2.2)

Rn?0其中,w(m)是窗函数,N是一帧语音信号的长度,因为语音信号的浊音段具有周期性,我们假设基音周期为P,则在浊音段,Fn(?)在???P,?2P,?3P?处将出现谷点,谷点间的距离即为基音周期。

实际应用中,窗函数w1(m)和w2(m)取矩形窗,这样可使短时平均幅度差函数

Fn(?)的定义更简单。短时平均幅度差函数可以写成:

1N?1Fn(?)??s(n)?s(n??)Rn?0??0,1,?N?1 (2.3)

由于Fn(?)只需加法、减法和取绝对值等计算,故算法简单,很易于硬件实现,从而使得短时平均幅度差函数法在基音检测中使用得相当普遍,著名的10阶线性预测声码器LPC-10声码器就采用AMDF法来进行基音周期的提取。研究表明:当在静音环境下或当噪声较小时,AMDF法可以取的较好的检测结果,但在语音环境较恶劣、信噪比较低时,检测的效果很差,难以让人满意。

如图2-3(a)是一帧语音信号,2-3(b)是这帧语音信号的平均幅度差函数,可以看出平均幅度差函数在基音周期处表现为谷值,这些谷值之间的间隔的平均值就是所要求得基音周期。如图2-4(a)是在这帧语音信号中加入信噪比是2dB噪声后的波形,由图2-4(b)可以看出它的平均幅度差函数中出现了很多谐波分量,基音峰值点基本淹没在这些谐波分量中,影响了基音周期的判断。

6


基音周期检测算法比较(2).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:计算机网络末考试试题加答案

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: