声音模型的识别与建立(2)

2021-09-24 09:51

短时自相关函数：自相关函数用于衡量信号自身时间波形的相似性。对于声音来说，采

用短时分析方法，可以定义短时自相关函数为：

Rn(k)

x(m) (n m)x(m k) (n k m)（4） m

短时自相关函数曲线如下图7、图8所示：

声音模型的识别与建立

图7 正常开门声音的自相关函数曲线

图8 非正常开门声音的自相关函数

声音模型的识别与建立

频域特征：频域分析主要是对声音波形进行傅里叶变换，如下图9所示：

图9 声音波形的傅里叶变换

由图9可以看出正常开门的对数幅度要比非正常开门的对数幅度小的多。程序源代码见

附录二。问题三

建立声音识别模型（二分类模型），利用模型区分正常和非正常声音，评价模型的好坏。问题三利用支持向量机构建二分类器对正常与非正常敲门进行分类预测。支持向量机是

Cortes和Vapnik于1995年提出的，与传统分类器比较，它在解决小样本、非线性及高维模式识别中表现出许多特有的优势，并能够推广应用到函数拟合等其他机器学习问题中。支持向量机方法是建立在统计学习理论的VC 维理论和结构风险最小原理基础上的，根据有限的样本信息在模型的复杂性和学习能力之间寻求最佳折衷，以期获得最好的推广能力。

声音模型的识别与建立

图10支持向量机分类器结构图

采集样本共有80组音频信号，从中选择60组数据做为训练数据训练网络，20组数据作

为测试数据测试网络分类能力。下面是准备数据步骤： Step1: 根据给定的数据，选定训练集和测试集； Step2: 为训练集与测试集选定标签集； Step3: 利用训练集进行训练分类器得到model；

Step4: 根据model，对测试集进行测试集得到accuracy rate；

训练集：trainset(); 分别取正常开门与非正常开门数据的一半作为训练集；测试集：testset(); 分别取正常开门与非正常开门数据的另一半作为测试集；标签集：label(); 取bedroom的数据为正类标签为1；forse的数据为负类标签为-1. 下面为svm二分类器的分类结果：

声音模型的识别与建立

图11基于支持向量机的分类器

上图将展示了训练与测试的结果，结果等于1表示正常声音，结果为-1为非正常开门声，

通过学习训练得到上图结果。程序源代码见附件三。

通过仿真，验证了支持向量机在解决分类问题中的优势，今后可以将这方法用于更深层

次的语音识别中。

问题四

试利用特征选择或变换，对特征向量进行优化，并利用参数优化技术优化模型的参数，

使识别模型的准确率提高。

问题四其中支持向量机的核函数主要有：线性核函数，多项式核函数，径向基核函数，

两层感知器核函数。不同的核函数直接影响SVM的分类能力，使用不同的核函数SVM分类的效果不同，所需要的时间也不同，下图是使用短时能量值和均值为特征参数，选取

RBF

声音模型的识别与建立

为核函数的分类效果图：

图 12 SVMRBF分类图

图13 分类模型错误率

此模型相比于问题三中建立的SVM分类模型分类正确率明显提高，达到了85.65%，可

见合适的核函数选取的重要意义。程序源代码见附录四。

声音模型的识别与建立

问题五

白噪声，是指功率谱密度在整个频域内均匀分布的噪声，即其功率谱密度为

p N

(5)

式中，N0为常数，。由于1和 (t)为一对傅里叶变换对，所以白噪声的自相关函数为

(6) Rn

由式(1)、式(2)可知，白噪声的自相关函数仅在 0时才不为零,而对于其他任意的，白噪声的自相关函数都为零，即在任意两个不同时刻上的随机变量都是不相关的。

对于一个线性时不变系统(如滤波器)，该系统是由它的冲激响应h(t)或等效地由它的频率响应H(f)表征，这里的h(t)和H(f)是一对傅里叶变换对。如果令x(t)为系统的输人信号，

y(t)是输出信号。系统的输出可以表示成如下形式：

y t h x t d

(7)

如果x(t)是平稳随机过程X(t)的样本函数，那么y(t)就是随机过程Y(t)的样本函数。可以求出输出的自相关函数是

R h h R d d (8)

由于我们知道自相关函数和功率谱密度函数是一对傅里叶变换对，所以可以得到输出过程的功率密度谱，即为相关函数的傅里叶变换：

f R e

j2 f

d xx f

H f

(9)

由此可以看出，输出信号的功率谱密度就是输入信号的功率谱密度乘以系统的频率响应的模的平方。当输入随机过程是白噪声时，输出随机过程的自相关特性和功率密度谱将完全由系统的频率响应所决定。

声音模型的识别与建立

我们设计了一个低通滤波器，对加了白噪声的声音信号进行滤波，即可去除白噪声。低

通滤波(Low-pass filter) 是一种过滤方式，规则为低频信号能正常通过，而超过设定临界值的高频信号则被阻隔、减弱。但是阻隔、减弱的幅度则会依据不同的频率以及不同的滤波程序（目的）而改变。在数字图像处理领域，从频域看，低通滤波可以对图像进行平滑去噪处理。滤波器将这部分不需要的频率滤除，就实现了去噪的效果。滤波前与滤波后的声音波形对比如下图所示：

图14滤波前后信号波形对比

实验表明低通滤波具有良好的去噪能力，该方法对添加的噪声处理后，与原始信号效果

几乎拟合。证明低通滤波对信号去噪是可行的。程序源代码见附录五

声音模型的识别与建立

附录一： clc;clear for i=5:7

j=2*(i-4)-1; a=['正' num2str(i)]; load(a)

subplot(3,2,j); plot(y)

title(['正' num2str(i)]) xlabel('Time');

ylabel('Amplitude'); a=['非' num2str(i)]; load(a)

subplot(3,2,j+1) plot(y)

title(['非' num2str(i)]) xlabel('Time');

共3页:

声音模型的识别与建立(2).doc 将本文的Word文档下载到电脑下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档