成都理工大学2012届本科毕业设计(论文)
语音信号采集 语音信号录入 语音信号变换 信号加噪 语音信号滤波 效果显示、对比
图1-1 论文设计的流程
3
成都理工大学2012届本科毕业设计(论文)
第2章 语音信号去噪方法的研究
2.2 去噪的原理
2.2.1 采样定理
在进行模拟/数字信号的转换过程中,当采样频率fs.max大于信号中,最高频率fmax的2倍时,即:fs.max>=2fmax,则采样之后的数字信号完整地保留了原始信号中的信息,一般实际应用中保证采样频率为信号最高频率的5~10倍;采样定理又称奈奎斯特定理。 1924年奈奎斯特(Nyquist)就推导出在理想低通信道的最高大码元传输速率的公式: 理想低通信道的最高大码元传输速率=2W*log2 N (其中W是理想低通信道的带宽,N是电平强度)为什么把采样频率设为8kHz?在数字通信中,根据采样定理, 最小采样频率为语音信号最高频率的2倍
频带为F的连续信号 f(t)可用一系列离散的采样值f(t1),f(t1±Δt),
f(t1±2Δt),...来表示,只要这些采样点的时间间隔Δt≤1/2F,便可根据各采样值完全恢复原来的信号f(t)。 这是时域采样定理的一种表述方式。 时域采样定理的另一种表述方式是:当时间信号函数f(t)的最高频率分量为
fM时,f(t)的值可由一系列采样间隔小于或等于1/2fM的采样值来确定,即采样点的重复频率f≥2fM。图为模拟信号和采样样本的示意图。
时域采样定理是采样误差理论、随机变量采样理论和多变量采样理论的基础。对于时间上受限制的连续信号f(t)(即当│t│>T时,f(t)=0,这里
T=T2-T1是信号的持续时间),若其频谱为F(ω),则可在频域上用一系列离散的采样值
(2-1)
采样值来表示,只要这些采样点的频率间隔
4
成都理工大学2012届本科毕业设计(论文)
(2-2)
。 2.2.2 采样频率
采样频率,也称为采样速度或者采样率,定义了每秒从连续信号中提取并组成离散信号的采样个数,它用赫兹(Hz)来表示。采样频率的倒数是采样周期或者叫作采样时间,它是采样之间的时间间隔。通俗的讲采样频率是指计算机每秒钟采集多少个声音样本,是描述声音文件的音质、音调,衡量声卡、声音文件的质量标准。
采样频率只能用于周期性采样的采样器,对于非周期性采样的采样器没有规则限制。 采样频率的常用的表示符号是 fs。 通俗的讲采样频率是指计算机每秒钟采集多少个声音样本,是描述声音文件的音质、音调,衡量声卡、声音文件的质量标准。采样频率越高,即采样的间隔时间越短,则在单位时间内计算机得到的声音样本数据就越多,对声音波形的表示也越精确。采样频率与声音频率之间有一定的关系,根据采样定理,只有采样频率高于声音信号最高频率的两倍时,才能把数字信号表示的声音还原成为原来的声音。这就是说采样频率是衡量声卡采集、记录和还原声音文件的质量标准。
采样位数和采样率对于音频接口来说是最为重要的两个指标,也是选择音频接口的两个重要标准。无论采样频率如何,理论上来说采样的位数决定了音频数据最大的力度范围。每增加一个采样位数相当于力度范围增加了6dB。采样位数越多则捕捉到的信号越精确。对于采样率来说你可以想象它类似于一个照相机,44.1kHz意味着音频流进入计算机时计算机每秒会对其拍照达441000次。显然采样率越高,计算机摄取的图片越多,对于原始音频的还原也越加精确
2.2 去噪的方法
数字信号处理技术经过几十年的发展,在国内外已经取得了很大的成绩。到
5
成都理工大学2012届本科毕业设计(论文)
目前为止,已经比较成熟的去噪方法比较典型的有切比雪夫去噪法、双线性变换去噪法、窗函数去噪法、谱相减去噪法、巴特沃兹去噪法等有名的去噪方法。下面分别对上述去噪方法中比较有代表性的谱相减去噪法和FIR以及IIR滤波法做一个简单的介绍。 (1)谱相减算法去噪法
在我们的日常交流和语音通信系统中,加性宽带噪声严重影响了语音质量和可懂度。从带噪语音中提取原始语音信号的方法很多,在单信道条件下,谱相减算法以其运算量小、原理简单、易于实现并且有不错的增强效果而得到了广泛的应用。谱相减语音增强算法的核心是噪声检测和谱减规则。在分析了语音增强算法理论的基础上,本文首先研究了语音激活检测算法。对基于短时能量和短时过零率双门限法语音激活检测的噪声估计算法做了研究及仿真,同时还研究了一种基于最小子带能量的噪声估计方法。然后,通过分析经典谱减法的原理及其一般改进形式,研究了一种基于噪声残差的谱相减改进算法和一种可以不以噪声是零均值的高斯分布为前提的谱减法改进算法。最后通过大量的仿真实验,验证了所研究的几种改进算法都能有效地提高增强效果。
由于谱相减算法去噪比较复杂,我们在这里就不多做讨论,并且本论文也不采用此种方法。下面着重讲解本论文采用的两种方法。 (2)FIR滤波法
FIR工作原理:在进入FIR滤波器前,首先要将信号通过A/D器件进行模数转换,使之成为8bit的数字信号,一般可用速度较高的逐次逼进式A/D转换器,不论采用乘累加方法还是分布式算法设计FIR滤波器,滤波器输出的数据都是一串序列,要使它能直观地反应出来,还需经过数模转换,因此由FPGA构成的FIR滤波器的输出须外接D/A模块。FPGA有着规整的内部逻辑阵列和丰富的连线资源,
特别适合于数字信号处理任务,相对于串行运算为主导的通用DSP芯片来说,其并行性和可扩展性更好,利用FPGA乘累加的快速算法,可以设计出高速的FIR数字滤波器。
FIR的特点:
有限长单位冲激响应(FIR)滤波器有以下特点: A位冲激响应h (n)在有限个n值处不为零 B系统函数0处收敛,极点全部在z = 0处
6
成都理工大学2012届本科毕业设计(论文)
C结构上主要是非递归结构,没有输出到输入的反馈,但有些结构中(例如频率抽样结构)也包含有反馈的递归部分。
设FIR滤波器的单位冲激响应h (n)为一个N点序列,0 ≤ n ≤N —1,则滤波器的系统函数为
H(z)=∑h(n)*z^-n (2-3)
就是说,它有(N—1)阶极点在z = 0处,有(N—1)个零点位于有限z平面的任何位置。 FIR滤波器基本结构:
FIR滤波器有以下几种基本结构: 横截型
式的系统的差分方程表达式为
y(n)=∑h(m)x(n-m) ( 2-4)
很明显,这就是线性移不变系统的卷积和公式,也是x (n)的延时链的横向结构,称为横截型结构或卷积型结构,也可称为直接型结构。将转置定理用于可得到的转置直接型结构。 FIR滤波器的横截型结构 级联型
其中[N/2]表示取N/2的整数部分。若N为偶数,则N—1为奇数,故系数B2K中有一个为零,这是因为,这时有奇数个根,其中复数根成共轭对必为偶数,必然有奇数个实根。画出N为奇数时,FIR滤波器的级联结构,其中每一个二阶因子用图4-11的横型结构。
这种结构的每一节控制一对零点,因而再需要控制传输零点时,可以采用它。但是这种结构所需要的系数B2k(I = 0,1,2,k,= 1,2,...,[N/2])比卷积型的系数h (n)要多,因而所需的乘法次数也比卷积型的要多。 (3)IIR滤波器去噪法
IIRnfinite Impulse Response)数字滤波器,又名“无限脉冲响应数字滤波器”,或“递归滤波器”。递归滤波器,也就是IIR数字滤波器,顾名思义,具有反馈,一般认为具有无限的脉冲响应。
7