兰州工业学院毕业设计说明书(论文)
环识别”模式。
这种口令触发模式,融合了其他两种模式的优点,并且结合第二节提到的“垃圾关键词语”的方法,可以为产品提供更加方便实用的语音操作特性。
2.5.4 关键词的ID及其设置
在把关键词语设置进LD 3320时,是把关键词语的拼音串传入LD 3320,并同时传入一个ID,用来代表这个关键词语。LD 3320的识别结果,也是把识别出的关键词语的ID作为结果输出。
在LD 3320芯片,不同的关键词语是可以对应同一个ID。 而且ID不需要是连续的。这样就为产品开发者提供了很方便的编程手段。
例如:“北京”,“首都”,可以设置为同一个ID,进行后续处理。 例如:在使用第二节提到的“垃圾关键词语”时,可以把添加的这些用来吸收错误的关键词语的ID都标记成一个值,或者把它们标注为比较特殊的ID值,如大于200。在程序中就比较简单,很容易处理误识别,避免了添加进很多关键词语后,写程序中需要为这些关键词语的处理增加过多的程序分支。
终端用户在说语音指令时,可能对同一个词汇有不同的发音习惯。 例如,“打开电灯”,用户可能会说“开灯”,“打开灯”,“打开电灯”,“把灯打开”等等。
充分利用LD 3320的50条可动态编辑的关键识别条目的特性,开发者可以把这些习惯发音都设置进芯片,这样无论用户怎么说,都会被正确识别出来,进一步增加终端用户的良好体验。
2.5.5 反应时间
LD 3320芯片内部是通过VAD(端点检测)机制来判断人是否说完语音,并给出识别结果根据VAD机制,语音识别芯片监测出有一段连续的背景噪音后,认为用户已经说完了语音识别命令,然后再给出识别结果。
默认设置是监测到在人声开始后有连续的600毫秒的不说话时,才会给出识别结果。也就是说,根据默认设置,从人说话结束,到语音识别芯片主动送出结果中断,至少要有600毫秒的间隔,如果用户希望调节这个反应间隔,可
16
兰州工业学院毕业设计说明书(论文)
以从以下几方面入手:
1、改变使用方式
采用类似于步话机的方式,每次人按键后,按下不放,开始说命令,说完命令后,松开按键,每次检测到松开按键时,主控的单片机通过设置BC寄存器来立即获得识别结果。
2、修改VAD判断的寄存器
Vad Silence End在语音检测到语音数据段以后,又检测到背景噪音段,连续检测到多长时间的背景噪音段才可以确认为是真正的语音结束。每1单位,10毫秒。Default:60,相当于600毫秒数值范围:20200(相当于2002000毫秒)但是这个修改会导致,如果这个时间过短,导致用户在说话时的说话停顿也会造成VAD检测认为说话结束,从而降低某些用户的识别率。
3、修改麦克风的音量
35寄存器,(建议调整范围在40H~58H之间),看哪个录音增益适合使用的麦克风,以及使用的环境。
4、修改B8寄存器
比如修改为2,那么这意味着,无论如何,在每次识别开始后2秒钟的时间内,必然会停止识别给出一个识别结果。
如果b8值特别小,比如设置:1, 2, 3,就需要在开始识别前,给用户一个很明确的提示,要开始识别了。免得用户还没有准备就识别时间过去了。但这个间隔设置的过短,也必然会引起一些可能存在的误识别,比如语音命令比较长,那么这个时间设置的太小,就会造成比较长的语音命令无法在特定时间内完整念完引起误识别。所以当这个数值设置比较小的时候,一般建议使用“触发识别”的用户界面,避免使用“循环识别”的用户界面。
5、改变使用环境
或许在某些环境中的噪声或者回声会影响到判断说话结束。以及说话人自己的音量,如果声音很低,也会导致判断人说话是否结束比较困难。改变命令词语内容,比较好念,开口音响亮等,方便使用者连续清晰念出语音命令。
17
兰州工业学院毕业设计说明书(论文)
2.6 GPRS模块
GPRS(General Packet Radio Service 通用分组无线业务)是在现有GSM(Global System for Mobile communication全球移动通信系统)基础上发展起来的一种新的承载业务,目的是为GSM用户提供分组形式的数据业务。GPRS采用与GSM同样的无线调制标准、频带、TDMA帧结构,因此在现有的基站子系统中增加一些模块即可提供 GPRS 服务。GPRS 允许用户在分组交换模式下发送和接收数据,从而提供了一种高效、低成本的无线数据分组业务。在GSM系统中,无线信道资源非常宝贵,而采用 GPRS 则可灵活运用无线信道,即每一个用户可以有多个无线信道,而同一信道又可以由几个用户共享,极大地提高了无线资源的利用率。GPRS使现有GSM 网的数据业务突破了最高速率为9.6kbit/s的限制,最高数据速率可达171.2kbit/s。将计算机通过串行通信技术与 GPRS 无线通信网络建立连接,可以实现手机与计算机的通信。计算机与GPRS网络的连接可以采用GPRS模块,也可以采用GPRS Modem,此处采用基于AT指令的 M22 GPRS 模块使计算机与 GPRS 网络进行连接,系统组成结构如图2-4所示。本文在Windows环境下,利用VB6.0中的Macomb控件实现GPRS模块与计算机的串行通信,采用ADO对象模型对数据库进行访问,实现语音拨号、语音发短信的功能。基于GPRS网络的应用系统组成结构如图2-6所示:
计 算 机 ARM9 微处理器 BenQ M22 GPRS 手 机 图2-6 基于GPRS 网络的应用系统组成结构
2.7 语音拨号模块
摘机后无需再用手拨(前提是手机支语音拨号表面地来说就是摘机后手动指向手机语音拨号功能,说出被叫者姓名,电话即自动拔向被叫者。一般分为6个步骤:
18
兰州工业学院毕业设计说明书(论文)
1、从第一画面进入拨号程序;
2、听到“请说出人名”的提示后说出要与之通信的人名;
3、手机将根据你的语音计算出数名声音类似的人名,第一条为首选; 4、如果第一条正确,且该人名仅有一个号码,按键拨号,或在默认时间内自动拨号,通话;如果该人名的联系电话多于一条,则启动“个人电话表”,选择,拨号;
5、如果第一条不正确,其余条中有正确的,按动上下键选择正确,按键,通话;
6、如果都不正确,按C键,返回第一画面。
在使用语音拨号之前,必须要录制声控标签,也就是说为电话薄中的几个电话号码录制声控标签。录制声控标签的具体操作步骤为:首先在手机面板中选择“加声控标签”按钮,在随后弹出的界面中选择所需的姓名和电话号码,接着再用手机按一下“功能键”,然后将手机贴近耳朵,用标准的话语来说出要录制的词语就算完成录制声控工作了。
2.8 语音短信模块
语音发短信是一款功能强大的语音声控助手,只要对软件下指令,软件即可用迅速简洁的方式协助用户达成任务,包括打开关闭应用程序,发送短信,拨打电话,撰写文本等等。重要的是,软件支持中文。同时语音发短信是一款出色的语音控制软件,其界面精美,简单易用。语音识别率很高,并支持中文等语言,对完成手机的基本操作非常实用。软件的使用方法如下:
1、单击“语音输入”按钮,进行语音短信输入,短信内容将会自动显示; 2、编辑好语音内容,单击“发送短信”按钮即可进入短信界面,进行短信发送;
3、也可以通过清空按钮清空短信框中的内容。
2.9 LCD显示连接电路
汉字一般是以点阵式存储的,如16×16,24×24点阵,汉字的字模其实
19
兰州工业学院毕业设计说明书(论文)
是汉字字形的图形化,所谓16点阵字模,就是把汉字写在一个16×16的网格内,汉字的笔划通过某网格时该网格就对应1,否则该网格对应0,这样,每一网格均对应1或0,把对应1的网格连起来看,就是这个汉字,汉字就是这样通过字节表示其点阵存储在字符字库中的,为了方便查找所需汉字的点阵,每个汉字都与一个双字节的内码一一对应,通过汉字的内码可以计算出它的点阵起始字节。现以16点阵为例来进行说明,首先,可由内码计算出它在汉字库中的区位码,其计算公式为:
BQ=Bn1-160 BW=Bn2-160
式中,BQ表示区码,Bw为表示位码,而Bn1和Bn2则分别表示内码的第一字节和内码的第二字节。当这些区位码被计算出来之后,就可以用区位码得到它在汉字库中字模第一个字节的位置,即:(BQ×94+Bw)×32。这样,接下来就可以向连续读出由32个字节组成的该字的点阵数据。液晶显示器作为一种低功耗显示器件,广泛应用于计算器、数字式仪表等低功耗系统中。但一般使用的液晶显示器均为七段笔划式,只能显示数字和少量字符,对于较复杂的字符或图形则无能为力。而点阵式液晶显示模块可以显示各种各样的字符(包括简单的汉字),而且点阵显示模块具有可编程能力。由于以上优点,点阵式液晶显示模块获得了广泛的应用。LCD显示连接电路如图2-7所示:
VCC+5 R17 A0 A1 EN AD0 AD1 AD2 AD3 AD4 AD5AD6AD7GNDCSACSB12345678910111213141516图2-7 LCD显示连接电路
20