哈尔滨理工大学学士学位论文 图4-4 测试文件的功率谱密度曲线
从功率谱密度曲线上我们可以看到,静音段的功率谱密度为零,这样我们可以划分出静音段,然后将剩余的部分分别计算其谱平坦测度,根据谱平坦测度值中出现无穷大的概率来区分音乐段和说话段。这样即可实现非常准确的语音分割。
4.5 音频信号的子带熵分析
图4-5 测试文件的子带熵曲线
对子带熵曲线进行分析,可以发现音乐段和静音段的平均值都较高,而说话段的子带熵的平均值则相对较低;同时,说话段子带熵的波动幅度较大,因而方差也会更大。因此,可用子带熵的均值和方差筛选出说话段,但此种方法同样无法有效区分音乐段和静音段。
- 21 -
哈尔滨理工大学学士学位论文 结论
本文的研究主要从音频特征分析与抽取、音频分割方法两个方面开展的,所取得的成果丰富了音频处理的研究工作,虽然还有不足和有待改进之处,但随着研究的进一步深入,问题最终会得到解决,所取得的成果必将在实践中得到很好的应用。本文主要是基于高级面向对象开发语言MATLAB的基本特征,以及MATLAB强大的工具箱功能,实现信号的预处理、信号的时域处理和信号的频域处理。其中实现信号的时域处理过程中,设计了加窗处理;在信号频域处理过程中,实现对语音信号的频谱分析。同时,通过上述实例说明,基于MATLAB可以很好的达到对语音信号的频谱的分析处理。
本文实现了用短时过零率、短时能量、FFT、低频能量比、子带熵、谱平坦测度以及功率谱密度的分析等方法实现语音信号端点检测,经实验证明,这种方法很好地分离出了用于系统处理的语音信号,有效地减少语音信号处理的数据量和时间,对提高语音识别系统的辨识率具有重要的意义。
- 22 -
哈尔滨理工大学学士学位论文 致谢
在此论文撰写过程中,要特别感谢我的老师颜景斌对我的指导与督促,同时感谢老师的谅解与包容。没有老师的帮助也就没有今天的这篇论文。求学历程是艰苦的,但又是快乐的。
在这四年的学期中结识的各位生活和学习上的挚友让我得到了人生最大的一笔财富。在此,也对他们表示衷心感谢。
谢谢我的父母,没有他们辛勤的付出也就没有我的今天,在这一刻,将最崇高的敬意献给你们!
本文参考了大量的文献资料,在此,向各学术界的前辈们致敬!
- 23 -
哈尔滨理工大学学士学位论文 参考文献
1 刘庆升,徐霄鹏,黄文浩.一种语音端点检测方法的探究.计算机工程,2003,3:24~35
2 马鸿飞,夏雨,郭泽华.新型低复杂度心理声学模型.西安电子科技.大学
学报(自 然科学版),2010,10:22~45
3 王晴蔚.Matlab在语音端点检测系统中的应用.科技创新导报,2010,6(2):27~50
4 韩纪庆.语音信号处理[M].北京.清华大学出版社,2004,5:44~48 5 赵力.语音信号处理[M].北京.机械工业出版社,2003,3:25~40 6 赵淑敏.基于MATLAB实现对语音信号频谱分析.技术前
沿,2010,7(2):78~92
7 姚天任.数字语音处理[M].武汉.华中科技大学出版社,1991,4:56-87 8 刘卫国. MATLAB程序设计教程[M].北京.中国水利水电出版社,2005,7:49~76
9 张登奇,蒋敏.基于MATLAB的音频信号处理技术实现.电脑知识与技术,2009,2:33~59
10 戴元红,陈鸿昶,乔德江,李乐.基于短时能量比的语音端点检测算法的
研究.通信技术,2009,8(1):92~122
11 刘羽.语音端点检测及其在MATLAB中的实现.计算机时代,2005,8:44~89 12 何强,何英.MATLAB扩展编程[M].清华大学出版社,2002,4(9):88~143 13 果永振,何遵文.一种多特征语音端点检测算法及实现.通讯技术,2009,3:98~156 14 李强,赵伟.MATLAB数据处理与应用.国防工业出版社,2001,10:21~54 15 Rabiner L.Juang BH.Fundamentals of Speech Recognition. Prentice-Hall International, 1993,4:79~205
16 Karine Marguerite, Alice ARNOUT. Zurich:Swiss Federal Institude of Technology Zurich .From Patterns to Components,2004,5:59~211 17 Douglas C,Schmidt, Frank. and Middleware Buschman. Patterns. Framework, 2003,6:66~112
- 24 -
哈尔滨理工大学学士学位论文
- 25 -