基于DS声源定位和AT89C52单片机设计的麦克风阵列语音增强系统

2018-12-08 20:26

课程论文

题目基于DS声源定位和AT89C52单片机设计的麦克风阵列语音增强系统

学生姓名学

号

院系专业

基于DS声源定位和AT89C52单片机设计的麦克风阵列语音增强系统文摘：

基于延迟叠加声源定位的原理，一个四通道语音增强的设计方案被提出了。这里介绍了硬件和软件设计的原理。硬件设计包括单片机，数模转换和模数转换器，电路连接等等。在设计软件时实时运行是一个非常重要的问题。为了解决这个问题，采用了软件和硬件相结合的方法。循环缓冲区技术也同样被使用了。实验结果表明该方案是有效的。关键字：

麦克风阵列；延迟叠加波速形成；AT89C52单片机；数模转换器；模数转换器 1.介绍

麦克风阵列广泛应用于语言通信应用程序的时空过滤，比如汽车环境等的有效的语音处理。因此，麦克风阵列语音增强的技术已经成为语音增强处理的重点。

空间滤波是一种基于麦克风阵列的信号采集的基本特征，在应用程序中扮演了一个重要的角色，比如语音增强和遥远的语音识别。

在这篇文章中，我们设计了一个便宜的小种麦克风阵列实现一个特定的语音增强技术，首先，介绍了声源定位延迟叠加原理用于语音增强。其次，提出了语音增强系统的设计方案，包括硬件和软件设计。硬件设计使用AT89C52单片机，ADS8515模数转换器和DAC8820数模转换器等。循环缓冲区技术被用于软件设计。同时，为了确保软件实时运行，该方法综合介绍了软件和硬件。最后，给出实验设。实验结果显示该设计能有效地产生增强输出。 2.延迟叠加波束形成

波束形成是根据所需信号的位置，从噪声和干扰区分空间滤波的方法。波束形成技术是经典DS声源定位实现定向陈列系统的最简单和最古老的技术。由于他们固有地带宽，因此大部分麦克风阵列语音采集的实现为DS声源定位。DS声源定位已经广泛地应用于测量，声源定位，DOA估计，免提语音应用程序等等。

DS声源定位是通过适当补偿信号延迟到每个麦克风之前结合使用一个加法运算，这延迟信号求和的结果是一个加强版的期望信号从不同的渠道减少噪音，DS的原理图显示在图1。

没有普遍性的损失，我们以第一个传感器作为参考信号。在传感器阵列中，一种广泛使用的信号模型假定每个传播通道只介绍了延迟和衰减，这种假设和场景中我们有N个传感器组成的一个数组，当k时，数组输出表示为1。

Fig. 1 The principle chart of DS An(n=1,2,…,N)它的范围在0到1之间，是由于传播衰减因素的影响，s(k)是未知源信号（可以是窄带也可以是宽带），t是来自未知源到传感器1的传播时间，vn(k)是一种添加在第N个传感器上的噪声信号，τ是传感器1和2之间的相对延迟(或通常叫做到达时差(TDOA)], τn是传感器1和传感器n. τ1之间的相对延迟等于0。

信号模型在传感器和参考点之间被给出了（1）和后移每个传感器信号对应的值时差，我们得到一下公式。

这个下标‘a’意味着一个一致的传感器信号。下一步是添加了时移信号,DS声源定位的输出形成如下

时差估计是DS波束形成时的一个重要问题。在所需的声音位置未知的情况下，时差估计有以下方法：互相关算法（CC），广义互相关（GCC）算法，空间线性预测方法，基于特征向量的方法，最小熵方法，自适应特征值分解算法等等[1]。总体来说，当使用麦克风序列语音增强时，麦克风阵列波束形成器的方向是设计点所需的声音。也就是说，所需的声音方向已知，因此时差估计可以简化。

Fig.2 An equispaced linear array

例如，N麦克风安装如图2所示，如果麦克风M1放在坐标原点，两个相邻传感器之间

的间距为d，如果从X轴逆时针测量声源波达方向所形成的角度θ，源信号s(k)位于远场，也就是说，声音是平面波，相对时间延迟τn如下，

为了避免空间混叠现象，元件间的间距d必须满足这个约束,

λ是波长，f是频率，c是声音在空气中的传播速度。 3.硬件和软件的设计

在这篇论文中，我们做一个假设源信号和噪声是互不相关的。我们还假定所有（1）中的信号是零均值平稳。设计线型麦克风阵列显示在图3，数组元素是四个全向麦克风, 元素之间的间距不统一。实验完成后用不同的元素间的空间反复实验，选择更好

的麦克风设置。M1和Mi（i=2，3,，4）之间的空间如表1所示。当期望信号位于X轴的负方向，采样频率为16KHz，τn是已知的。在这里，时差是表示样本，一个样本对

应的时间是1/16000秒。

M1 M2 M3 M4

0 4.25 8.5 17 x(cm) Fig.3 the element position of microphone

Table 1 The position relation and time different of

microphone array interelement

Relation Space between M1 and Mi(cm) Time different between M1 and Mi(samples) M2 4.25 2 4 M3 8.5 8 M4 17 i=2,3,4

图4是麦克风阵列语音增强系统的结构图，便宜的AT89C52处理器[ 8 ]是电路设计的选择。四件ADS8515 [ 9 ]四通道的模拟声音信号转换为数字数据，传输到不同大小的循环缓冲区设置在AT89C52内部的RAM。不同大小的环形缓冲区的实现补偿的时间不同。确保每个通道的期望信号是一致的。环形缓冲区是显示在图5，缓冲区的大小是L，Ri和Rj分别读写指针，它的种类如下：

使用P2.0-P2.3和P2.5 AT89C52单片机控制四块ADS8515模数转换器mltlates转换同步。所有的模数转换完成后，四对ADS8515忙信号与AT89C52信号一起发送中断请求。如果中断程序启动，它先后通过总线将数据转换到各自的环形缓冲区。AT89C52的P2.6控制是否接受中断请求信号。

在这里，只有转换的高14位数据传送到环形缓冲区，也就是说，转换后的数据在传输

之前对环形缓冲区右移两位。这个过程的目的是在编程时在公式（3）中省略划分N（图4中N = 4），缩短运行时间，为了实现实时中断程序。

Fig.4 The circuit frame of microphone array speech enhancement system

Fig.5 Ring buffer of size L

AT89C52单片机的P2.4控制总线上写的数模转换器的输入寄存器DAC8820延迟叠加的结果[10]。转换后的模拟信号是从DAC8820的引脚中输出。

它必须说明微弱的麦克风信号发送到ADS8515的VIN引脚前需要通过放大器放大。DAC8820的输出模拟信号需要放大，驱动扬声器或耳机同样如此。

该软件组成的主要过程是T0中断程序和外部中断0程序。主要过程实现初始化T0定时器和中断系统。T0定时器每1 / 16000秒中产生中断信号，中断程序控制四通道AD转换器将同步通过p2.0-p2.3和P2.5发送适当的信号。外部中断0程序发送数据到每个环形缓冲区的有序转换，实现DS操作，并把结果DS发送到AD转换器得到增强的语音信号。

外部中断0由定时器中断信号驱动，因此，优化方案确保实时运行是关键问题。优化的外部中断程序需要88个机器周期运行一次，也就是说，机器周期必须小于0.71μS，所以振荡器的频率一定要大16.896MHz（AT89C52的最大振荡频率为24MHz）。 4.实验

4.1实验条件和评价数据

实验是在一个房间里完成的,房间的长度,宽度和高度是3500mm,3100mm和2650mm。声源是两个扬声器播放记录的音频。扬声器播放的男性和女性的声音，音乐，噪声（工厂，机场，白噪声）。 4.2实验结果和分析

图6是实验语音信号波形的一个例子，（a）是参考声音，它是直接从扬声器输入捕获。（b）是一个信道的噪声语音。（C）是DS波束形成的增强语音。研究发现，背景噪音减弱。所需语音的质量有效地提高。SNR（信噪比）平均提高了约2.1分贝。

Fig.6 a example of Speech waveform ( a) Reference speech (b) Noisy speech (c )Enhanced speech with DS 5.结论

基于分析的延迟与求和的原则，我们提出了一个单片机四通道语音增强的设计方案。实验结果表明该提议方案是有效的。设计的电路的成本低廉和应用前景是好的。致谢

这项研究是由中国国家自然科学基金（No.91120303，NO.90820011和No.90820303）和福建自然科学基金（No.2009JO1296）的部分资助。参考：

[1]Jacob Benesty，陈京东,黄毅腾，“麦克风阵列信号处理”，施普林格，柏林海德堡，2008年。

[2]Ngoc-Vinh Vu，叶华，Jim Whittington， John Devlin，“Michael Mason的双麦克风延迟与求和波束形成小尺寸实现了车载语音增强”，ICASSP2010年，达拉斯，德克萨斯州，美国，pp.1482-1485。

[3] Feger Reinhard，Scheiblhofer Stefan， Stelzer Andreas,，Schmid Christian M.，“线性天线阵列基于测量的延迟与和信号处理”ICWlTS2010，檀香山，夏威夷，美国，pp.I-4。 [4]Dae-hoon Seo,，Yang-Hann Kim，“脉冲声源定位使用延迟和求和波束形成方法生病时域”，INTER-NOISE2010年，葡萄牙里斯本，pp5473-5482。

[5] Antònio L.L.Ramos,，Sverre Holm，Sigmund Gudvangen,，Ragnvald Otterlei，“延迟与求和波束形成波达方向估计应用于枪击声”，会议上的传感器和指挥，控制，通信和情报（C3I）技术国土安全和国土防御X，奥兰多2011年，佛罗里达州（美国），pp.I-9。 [6] Taghizadeh, Mohammad J，Garner, Philip N，Bourlard Herve,，“麦克风阵列波束图表征免提语音应用”，IEEE2012第七届传感器阵列和多通道信号处理车间，新泽西州霍博肯市（美国），PP.465-468。

[7]Jeein Noh，Hyun Jom,，Youngjin Park，Youn-sik Park，“声耳机重点基于延迟与求和波束形成”，ICCAS2010年，京畿道，韩国，pp.2061-2064。 [8]8位微控制器具有8K字节的闪存AT89C52. http//www.atmel.com/images/doc0313.pdf。 [9]16位，250 kSPS时，采样CMOS类比数位转换器（Rev.D)http://www.ti.com/lit/gpn/ads8515。 [10]16位并行输入乘法数位类比转换器（修订版） http：//www.ti.comllitv/pdf/sbas358d。

共2页:

基于DS声源定位和AT89C52单片机设计的麦克风阵列语音增强系统.doc 将本文的Word文档下载到电脑下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档