数字变声器

2020-04-14 06:56

数字变声器

摘要 为了实现由男声变换到女声,在语音信号参数分析过程采用短时自相关法提取语音信号的基音周期,同时用LPC倒谱分析法分析共振峰的范围,通过matlab编写程序修改语音参数并接近于女声的范围,构置GUI界面。在实验中,输入一段语音信号,输出时即实现了由男声到女声的变换效果。因此对于语音信号参数的修改能够实现男女声音之间的变换。

关键词 短时自相关法 LPC倒谱 语音信号 matlab GUI

前言

为了锻炼自己数字信号处理的实践能力,也为了更好的完成老师布置的作业,

本设计通过编写matlab程序,修改相关声音参数,使其频率发生相应的变化,在输出时达到变声。

1 / 24

目录

数字变声器 ...................................................................................................................................... 1 第1章 采样............................................................................................................................... 4

1 一些基本概念 ....................................................................................................................... 4 1.1 声道............................................................................................................................... 4 1.2 基音............................................................................................................................... 4 1.3 共振峰........................................................................................................................... 4 1.4 物理原理 ....................................................................................................................... 4 第2章 设计方案 ....................................................................................................................... 5

2.1 设计原理 ......................................................................................................................... 5 2.2 设计步骤 ......................................................................................................................... 5 第3章 建模............................................................................................................................... 5

3.1 基于短时自相关法的基音周期估值 ............................................................................. 5

3.1.1构建巴特沃斯低通滤波器 .................................................................................... 5 3.1.2语音信号的短时自相关函数 ................................................................................ 6 3.2 LPC倒谱法提取共振峰 .................................................................................................... 6 3.3 线性预测语音信号合成 ................................................................................................... 7 第4章 GUI界面设计以及仿真图形和程序.................................................................................. 8

4.1 界面设计 ........................................................................................................................... 8 4.2 仿真图形 ........................................................................................................................... 9

4.2.1 原声 ..................................................................................................................... 10 4.2.2 女声 ..................................................................................................................... 10 4.2.3 童声 ..................................................................................................................... 10 4.2.4 老人声 ................................................................................................................. 10 4.2.5 音调变高 ............................................................................................................. 11 4.2.6 音调变低 ............................................................................................................. 11 4.2.7 语速变慢 ............................................................................................................. 11 4.2.8 语速变快 ............................................................................................................. 12 4.3 程序流程图如下 ............................................................................................................. 12 4.4每个控件的程序如下 ...................................................................................................... 13

4.4.1“录音”radiobutton(radiobutton1) ......................................................... 13 4.4.2“打开”radiobutton(radiobutton2) ......................................................... 13 4.4.3“开始 ”按钮(pushbutton1) ....................................................................... 14 4.4.4“保存”按钮(pushbutton2) ......................................................................... 14 4.4.5“打开音频文件按钮”(pushbutton3) ........................................................... 15 4.4.6“原声”按钮(pushbutton5) ......................................................................... 15 4.4.7“女声”按钮(pushbutton7) ......................................................................... 16 4.4.8“童声”按钮(pushbutton6) ......................................................................... 17 4.4.9“老人”按钮(pushbutton12) ....................................................................... 19 4.4.10“音调变高”按钮(pushbutton11) ............................................................. 20 4.4.11“音调变低”按钮(pushbutton9) ............................................................... 21 4.4.12“语速变慢”按钮(pushbutton14) ............................................................. 21

2 / 24

4.4.13“语速变快”按钮(pushbutton8) ............................................................... 23

第4章 分析总结 ..................................................................................................................... 24 参考文献......................................................................................................................................... 24 致谢 ................................................................................................................ 错误!未定义书签。

3 / 24

第1章 采样

1 一些基本概念

1.1 声道

声道是很多动物及人类都有的一个腔室,从声源产生的声音经由此处滤出。人的声道包括声道则包括喉腔、咽头、口腔和鼻腔。 1.2 基音

一般的声音都是由发音体发出的一系列频率、振幅各不相同的振动复合而成的。这些振动中有一个频率最低的振动,由它发出的音就是基音,其余为泛音。发音体整体振动产生的音,叫做基音,决定音高;发音体部分振动产生的音,叫做泛音,决定音色;基音和泛音结合一起而形成的音,叫做复合音,日常我们所听到的声音多为复合音。 1.3 共振峰

共振峰是指在声音的频谱中能量相对集中的一些区域,共振峰不但是音质的决定因素,而且反映了声道(共振腔)的物理特征。声音在经过共振腔时,受到腔体的滤波作用,使得频域中不同频率的能量重新分配,一部分因为共振腔的共振作用得到强化,另一部分则受到衰减,得到强化的那些频率在时频分析的语图上表现为浓重的黑色条纹。由于能量分布不均匀,强的部分犹如山峰一般,故而称之为共振峰。 1.4 物理原理

语音科学家将人类发声过程视作一个由声门源输送的气流经以声道、口、鼻腔组成的滤波器调制而成的。人类语音可分为有380声语音和无声语音,前者是由声带振动激励的脉冲信号经声腔调制变成不同的音,它是人类语言中元音的基础,声带振动的频率称为基频。无声语音则是声带保持开启状态,禁止振动引发的。一般来说,由声门振动决定的基频跟说话人的性别特征有关,如下表,而无声语音则没有体现这个特征。说话人的个性化音色和语音的另外一个声学参数——共振峰频率的分布有关。儿童由于声道短,其共振峰频率高于成年人,成年女性的声道一般短于成年男性,所以女性的共振峰频率一般高于男性。本实验是基于男生录制的声音进行相关参数提取,修改接近于女声、童声、老人声,并实现了音调的高低与速度的快慢

男声 基频分布(hz):50~180 共振峰频率分布:偏低

人群 女声 基频分布(hz):160~380 共振峰频率分布:中

童声 基频分布(hz):400~1000 共振峰频率分布:偏高

4 / 24

第2章 设计方案

2.1 设计原理

采用线性预测参数合成法。线性预测参数合成法利用LPC语音分析方法,通过分析自然语音样本,计算出LPC系数,就可以建立信号产生模型,从而合成出语音。 2.2 设计步骤

它包括以下几个步骤:1、先用短时自相关法对基音周期估值。2、用LPC倒谱法提取共振峰。3、线性预测语音信号合成,根据线性预测的基本思想,用过去M个样点值来预测现在或未来的样点值。4、用matlap编程和matlap GUI界面设计。

第3章 建模

3.1 基于短时自相关法的基音周期估值

对语言信号进行低通滤波,然后进行自相关计算。在低通滤波时,采用巴特沃斯滤波器

3.1.1构建巴特沃斯低通滤波器

根据人的说话特征设定相应指标参数,对本段语音设计算出巴特沃斯模拟滤波器的阶数N为5,3dB截止频率归一化低通原型系统函数为:

,

,算出

为0.175,

其中将

带人

中,得到低通滤波器,

根据设定的滤波器编写matlab程序,当信号经过低通滤波器后,对原始信号滤波产生结果如下图所示,低通滤波后,保留基音频率,然后再用8kHz采样

5 / 24


数字变声器.doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:一个治安主任关于社区治安管理的思考(治安主任)

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: