2012届毕业设计说明书
1 引言
1.1 研究背景和意义
在各种电子设备高度智能化的今天,语音增强与声源定位技术成为语音通信领域中两种不可缺少的技术。例如,在视频会议中,通过声源定位技术控制摄像头,使其自动转向感兴趣的说话人方向;对于高速行驶的车辆,为避免驾驶员用手去接听电话,车载免提电话应运而生[1]。然而,当车中坐有多个说话人时,语音识别系统就无法辨别实际命令的来源,此时就需要一种定位系统来提取驾驶员方位的语音,进而对其命令作出响应;助听器的出现为有听觉障碍的残疾人提供了帮助,基于阵列的语音增强技术利用声源的位置信息进行空间滤波,可以进一步抑制除说话人以外的其他方向的噪声,使得助听器话音更加清晰。
声源的定位在各个领域都有着广泛的应用,尤其是利用传声器阵列的方法,在电话会议、视频会议、可视电话等系统中控制摄像头和传声器阵列波束方向对准正在说话的人,发挥了强大的功能。早在20 世纪七八十年代,声源定位系统就开始被广泛地研究。用于声源定位的传声器阵列具有很强的空间选择性,不需要移动传声器就可以获得移动目标的声音信号,并且能够在一定范围内实现声源的自适应检测、定位及跟踪。这种声源定位技术主要可以分成3 类:第一类是基于最大输出功率的可控波束形成技术,当传声器阵列探测到信号时,对各路信号进行加权求和形成波束,直到得到具有最大输出功率的波束为止;第二类是高分辨率谱估计技术,这类技术需要利用传声器阵列所获取的信号计算空间谱的相关矩阵,运算量大,定位不准确,在实际操作过程中很少采用;第三类是基于声达时间差(time difference of arrival , TDOA) 的定位技术,利用到达阵列上各传声器的声音信号间的时间差未定位声源,这类技术计算量小,比较适用于实时处理,在实际应用中占有很大的比重[2]。 1.2 声源定位技术的研究现状及发展 1.2.1 研究历史和现状
近年来,传感器和探测技术、微电子技术、信号处理技术以及人工智能技术的飞速发展,均为声探测技术用于直升机等军事目标的定位、跟踪和识别幵辟了新的应用前景,使声探测技术成为一种重要的军事侦察手段和防空作战中反电子干扰和反低空突防的一种有效途径。声探测技术就是利用直升机飞行及坦克行进时的噪声和振动信号,实现
第 1 页 共 38 页
2012届毕业设计说明书
对目标的自动探测、跟踪和识别。美英等国研制的声智能雷弹系统,就是采用了这一思想来对付超低空飞行的直升机。采用声复合引信的反直升机、反坦克智能雷弹系统具有独立自主的作战能力。单枚雷弹的杀伤半径将超过100km,与普通雷弹系统相比,极大地提高了武器系统的有效性,如法国的MAZAC反坦克雷弹,单枚雷弹的效能相当于60枚普通地雷的综合效能[3]。因此,智能雷弹系统在构成雷场时所需的弹药数量最少,可以最大限度地减轻战时与和平时期的后勤保障负担,具有显著的作战效益和经济效益。发展这种系统的关键在于,研制一种声或声复合引信,而声阵的布设方法及目标定位、跟踪方法的研究是声引信的核心。
和平与发展是当今世界的两大主题,但世界并不太平,一些局部战争不断发生。历史遗留下来的边界和领土争端、南海诸岛的主权争议以及台湾问题等都对我国构成了不安定的因素。一些主要的邻国装备了相当数量性能优良的武装直升机和坦克,并在不断提高其武器装备的现代化水平,已对我国的国家安全构成了潜在的威胁。研究声源定位技术,加强我军反直升机、反坦克武器系统的装备水平,对我国的国防现代化建设具有重要意义。 1.2.2 发展趋势
声源定位技术是利用声学与电子装置接收目标声场信息以确定目标声源位置的一种技术,能够用于探测武装直升机、坦克、火炮等军事目标的位置,是一种重要的军事侦察手段。其方法可分为被动定位系统和主动定位系统两大类。被动声定位系统属于辐射源无源定位,它具有作用距离远,隐蔽性好等优点。主动声定位系统容易暴露自己,被对方发现,影响系统自身的安全。
进行利用声探测技术进行目标识别、跟踪和定位最早见于声呐,由于电磁波在海水中的传播衰减很大,作用距离受到限制,因此,声波被广泛用于水下目标的探测。地面声测产生于第一次世界大战。地面声测侦察在炮兵作战中曾立下汗马功劳,用于确定堑壕战中敌人武器的方位。据统计,在第二次世界大战和朝鲜战争中有75%的火炮侦察任务是利用声测手段完成的。随着雷达、红外、激 光侦察技术的兴起,声测技术曾一度受到冷落。近年来,由于雷达面临着电子干扰、反辐射导弹、低空突防和隐身技术这四大威胁,越来越容易遭受攻击,因此,人们又开始重视被动式声探测系统,重新激起对声探测技术的兴趣[4]。
第 2 页 共 38 页
2012届毕业设计说明书
反坦克等智能武器的研究幵发是必要的、紧迫的,这是对地面防空力量的重要补充。声测系统作为一种传统的侦察手段,近年来通过釆用新技术,提高了性能,满足了现代化战争的需要,其主要特点是:(1)不受通视条件的限制。可见光,激光和无线电侦察器材则需要通视目标,在侦察器和目标之间不能有遮蔽物,而声测系统可以侦察遮蔽物〔如山,树林等〕后面的声源。(2)隐蔽性强。声测系统不受电磁波干扰也不会被无线电测向及定位,工作隐蔽性强。(3)不受能见度限制。其它侦察器材受环境气候影响较大。在恶劣气候条件下工作时,性能下降,甚至无法工作,声测系统可以在夜间,阴天,雾天和下雪天工作,具有全天候工作的特点。
在几十年的发展过程中,声测系统的基本原理和设计变化不大,主要是通过釆用釆用各种现代化技术实现了自动化、集成电路化,提髙了性能。现有的声测 系统一般用热线,碳粒或电容传声器接收声音信号,用无线电技术或光纤技术传输信号,用电蚀纸带或墨水纸带记录测量结果,并把记录仪与计算机相连,用计算机处理测量结果。声测基线采用直线,弧线,正方形等多种形式。目前,声测系统的侦察距离可达30km,精度达到1%,无线电传输方式的展幵时间仅需半小时,可同时测量50多个目标[5]。
目前,这些国家研制的声探测系统都具有战场侦察、目标定位跟踪和敌我识别等综合作战能力,而且它们的研制已经进入了实质性的研制阶段,而我国在这方面的研究仍处于预研阶段,拟釆用的技术手段和途径仍处于可行性探索阶段,与其他国家相比还有很大的差距。
1.3 麦克风声源定位技术
麦克风阵列是获取高质量语音信号的重要途径。麦克风阵列语音采集系统能在多种环境下(混响、噪声、竞争声源、说话者运动)为后继的语音识别系统和编码系统等提供高质量的语音数据,而且还能定位声源位置和跟踪声源运动。准确的声源定位能引导麦克风阵列增强感兴趣的语音,同时抑制干扰语音和噪音。
声源定位技术是利用声学与电子装置接收目标声场信息以确定目标声源位置的一种技术。麦克风阵列的声源定位是指用麦克风阵列拾取声音信号,通过对多路声音信号进行分析与处理,在空间域中定曲一个或多个声源的平面或空间坐标,即得到声源的位置,以进一步控制摄像机和麦克风阵列波束对准正在说话的人。基于麦克风阵列的声源定位在视频会议、声控机器人、车载电话系统和语音导航系统、智能空间中的人机交互、声源的实时跟踪和监控等诸多领域具有广泛的应用前景。我们提出了有效的高分辨率多
第 3 页 共 38 页
2012届毕业设计说明书
声源定位方法,适用于存在较强混响的环境。目前,基于麦克风阵列的声源定位方法大体上可分为三类:(1)基于子空间的定位技术;(2)基于可控波束形成的定位技术;(3)基于到达时延(TDOA)的定位技术[6]。TDOA方法首先求出声音到达不同位置麦克风的时延,再利用这些时延求得声音到达不同位置麦克风的距离差,最后用搜索或几何知识确定声源位置。在现有的麦克风阵列声源定位方法中,基于到达时间差(TDOA)估计定位法计算量较小,硬件成本较低,定位精度较高,同时也易于实时实现,是目前声源定位法中常用的方法。 1.4 本文所要研究的内容
本文的研究内容是学习声学理论基础知识和被动声定位的原理,参与设计基于多麦克风的声源定位系统,在此基础上研究四元阵列、五元阵列以及多元阵的定位算法,分别对定位精度进行分析,采用matlab进行仿真,并指出影响定位精度的因素。具体研究工作如下:
第一章概述了麦克风声源定位技术研究的背景和意义、历史发展以及国内外研究现状。
第二章主要概述了声学理论的基础知识及声波的物理传播特性,并简述了声源定位原理,继而为后面研究声源定位技术打好基础。
第三章论述了基于时延估计的声源定位算法,推导出了四元、五元十字阵的声源定位方程;并对四元和五元两种十字阵的定位精度进行了理论分析和仿真对比。
第四章在第三章的基础上,分析了多元麦克风阵列的声源定位及定位精度;并用实际数据对上述算法及麦克风阵列声源定位精度进行了计算求均方根误差。
第五章对全文作了总结。
第 4 页 共 38 页
2012届毕业设计说明书
2 声学理论基础知识
2.1 空气的物理特性
当声波在空气媒质中传播时,空气的物理特性,如密度、温度、压强、比热 和粘滞性系数等,会直接影响到声波的物理特性。 (1) 空气的密度
空气密度可根据表达式(2.1)来计算
??1.29?273.2P (2.1)?5T1.013?10式中 T——绝对温度(K); P——大气压强(Pa); (2) 声速
对于理想气体而言,声波的传播速度可表示为 c???R(273?t) (2.2)
?式中 ?——气体摩尔质量 ?——比热比
对空气来说,?=1.402,?=29×10?3千克/摩尔;R为气体常数,可表示为R=8.31焦耳/(开尔文·摩尔);因此,对于空气介质来说,声波在其中的传播速度可表示为: c?331.4?1?t273 或c?331.6?0.6?t (2.3)
其中t表示摄氏温度(℃)。在常温下,空气中的声速大约为:340m/s。 2.2 声波的物理特性
当外力对介质的某一部分产生初始扰动时,这种扰动就将由一个质点传播到另一个质点,交替形成密层和疏层;如此继续传播下去,就形成了波。当这种扰动表现为弹性变形时,就视其为以弹性波的形式传播信息。
声音本质上是物体的机械振动对气体介质的一种扰动,这种扰动使气体介质的压强,以及密度、温度和速度等发生周期性的变化,忽强忽弱,疏密相间。这 种周期性的变化在各向同性的介质中,是借助介质的弹性向四面八方传播。由于声波的频率范围
第 5 页 共 38 页