兰州工业学院毕业设计说明书(论文)
S3C2410系统管理:小端/大端支持;地址空间:每个BANK128MB(全部为1GB);每个BANK可编程为8/16/32位数据总线;BANK0到BANK6为固定起始地址;BANK7可编程BANK起始地址和大小;一共8个存储器BANK;前6个存储器BANK用于ROM、SRAM和其它;两个存储器BANK用于ROM、SRAM、和SDRAM(同步随机存储器);支持等待信号用以扩展总线周期;支持SDRAM掉电模式下的自刷新;支持不同类型的ROM用于启动(NOR/NAND Flash、EEPROM和其它)。
S3C2410芯片封装与型号:272-FBGA封装;S3C2410A-20、S3C2410A-26; 区别:前者主频最高为200MHZ、后者主频最高为266MHZ。
S3C2410连接电路图2-4所示:
DATA0DATA143DATA242DATA341DATA440DATA5 39DATA638DATA7 34DATA833DDAATTAA91032DATA11313029DB0DB1DB2DB3DB4DB5DB6DB7DB8DDB1B09 EINT0 1 2 CONV START 3 NGCSI 4 nOE 5 VDD5V 6 44 2 27 28 BUSY FRSTDATA CONVST CS RD WR EOC INT/EXT-CLK CLKINDB11 DVDD DGND AGND AGND AGNDAVDD VREF VREF-GND 35 37 17 12 26 25 2423 VDD5V AGND AGND AGND ADD5V 1 C39 2 104 1 R39 10K 10K H/S SELAGNDAIN8AGNDAIN7AGNDAIN6AGNDAIN5Vin4bVin4a13Vin3b14Vin3a15Vin2b16Vin2a18Vin1b19Vin1a20211 VDD33V36 AVDD5V22 R40 2 11 STBYTe SL4SL3SL2SL1 10 9 8 7 VDD5V
图2-4 S3C2410连接电路图
2.5 语音识别模块
LD 3320的内部集成了快速稳定的优化算法,不需外接Fla-sh、RAM,不需要用户事先训练和录音而完成非特定人语音识别,识别准确率高。
11
兰州工业学院毕业设计说明书(论文)
LD 3320采用并行方式直接与AR9 S3C2410相接,均采用1 kΩ电阻上拉,A0用于判断是数据段还是地址段;控制信号RDB、WRB、CSB,复位信号RSTB以及中断返回信号INTB与AR9 S3C2410直接相连,采用10kΩ电阻上拉,辅助系统稳定工作;和AR9 S3C2410采用同一个外部8 MHz时钟;发光二极管D1、D2用于复位后的上电指示;MBS(引脚12)作为麦克风偏置,接了一个RC电路,保证能输出一个浮动电压给麦克风。LD 3320语音识别单元设计原理图如图2-5所示:
图2-5 LD 3320语音识别单元设计原理图
2.5.1 LD 3320芯片简介
LD 3320是一颗基于非特定人语音识别(SI-ASR,Speaker Independent Automatic Speech Recognition)技术的语音识别/声控芯片。该芯片集成了语音识别处理器和一些外部电路,包括ADC、DAC、麦克风接口、声音输出接口等。该芯片不需要外接任何的辅助芯片如Flash、RAM等,直接集成在现有的产品中,即可以实现语音识别/声控/人机对话功能,并且,识别的关键词语列
12
兰州工业学院毕业设计说明书(论文)
表是可以任意动态编辑的。LD 3320完成非特定人语音识别,每次识别最多可以设置50项候选识别句,每个识别句可以是单字、词组或短句,长度为不超过10个汉字或者79个字节的拼音串。另一方面,识别句内容可以动态编辑修改,因此可由一个系统支持多种场景。芯片采用48脚QFN塑料封装,工作供电为3.3V。其核心是语音识别运算器,配合输入、输出、AD/DA转换等模块,完成语音识别的功能。LD 3320还支持并行和串行接口,串行方式可以简化与其他模块的连接。
LD 3320 电路说明:1、电压要求 VDD: 数字电路用电源输入3.0 V~3.3 V ,VDDIO: 数字 I/O 电路用电源输入1.65 V~VDD ,VDDA:模拟电路用电源输入3.0 V~4.0 V。 2、芯片管脚输入电压范围:高电压(逻辑“1”):0.7*VDDIO
~VDDIO 低电压(逻辑“0”):0~0.3*VDDIO 因此,开发者需要保证自己使
用的主控 MCU 同样工作在 3.3v,保证主控 MCU 向 LD 3320 的管脚输出的高电压不超过 3.3V。
2.5.2 LD 3320功能单元
1、时钟(Clock)
芯片必须连接外部时钟,可接受的频率范围是 4—48MHz,而芯片内部还有 PLL 频率合成器,可产生特定的频率供内部模块使用。
2、复位
对芯片的复位信号(RSTB*)必须在 VDD/VDDA/VDDIO 都稳定后进行。无论芯片正在进行何种运算,复位信号都可以使它恢复初始状态,并使各寄存器复位。如果没有后续的指令(对寄存器的设置),复位后芯片将进入休眠状态。此后,一个 CSB*信号就可以重新激活芯片进入工作状态。
3、并行接口
本芯片可通过并行方式和外部主CPU连接,此时使用8根数据线(P0-P7),4个控制信号(WRB*, RDB*, CS*,A0),以及一个中断返回信号(INTB*)。
4、串行接口
串行接口通过SPI协议和外部CPU连接,首先要将 MD 接高电平,而将
13
兰州工业学院毕业设计说明书(论文)
(SPIS*)接地。此时只使用4个管脚:片选(SCS*)、SPI时钟(SDCK)、SPI 输入(SDI)和 SPI 输出(SDO)。
5、寄存器
对芯片的设置和命令,包括传送数据和接受数据,都是通过对寄存器的操作来完成的。例如进行语音识别时,设置识别的关键词语列表,设定 芯片的识别模式,识别完成后获得识别结果都是通过读/写寄存器来完成。播放声音时,就是将 MP3 格式的数据循环放入 FIFO 对应的寄存器。(识别结果是通过寄存器返回识别出的关键词语在关键词语列表中的排列序号 Index 数值,该 Index 数值是在设置关键词语列表时指定)。
6、喇叭音量的外部控制
除了特定寄存器来控制音量以外,芯片外部的电路可以控制喇叭的音量增益。使用的是 EP1、EP2、EP3 对应的管脚。
7、快速开发和评估验证
为了方便开发者对于LD 3320芯片进行快速开发和评估验证,ICRoute 提供了开发板和模块。
2.5.3 LD 3320芯片模式选择
用户可以通过编程,设置两种不同的用户使用模式:“触发识别模式”和“循环识别模式”:
1、触发识别模式:
系统的主控MCU在接受到外界一个触发后(比如用户按动某个按键),启动LD 3320芯片的一个定时识别过程(比如5秒钟),要求用户在这个定时过程中说出要识别的语音关键词语。过了这个过程后,需要用户再次触发才能再次启动一个识别过程。
2、循环识别模式:
系统的主控MCU反复启动识别过程。如果没有人说话没有识别结果,则每次识别过程的定时到时后再启动一个识别过程;如果有识别结果,则根据识别作相应处理后(比如播放某个声音作为回答)再启动一个识别过程。一般来说,
14
兰州工业学院毕业设计说明书(论文)
触发识别适合识别精度要求比较高的场合。外界触发后,产品可以播放提示音或者其他方式来提示用户在接下来的几秒钟内说出要识别的内容,这样来引导用户在规定的时间内只说出要识别的内容,从而保证比较高的识别率。而循环识别比较适合需要始终进行语音监控的场合,或者没有按键等其他设备控制识别开始的场合。而这种状态,识别准确度会有一定下降,在循环识别的过程中,用户的其他说话声音,或者外界的其他声音,都有可能被识别引擎误识别出错误的结果,需要产品的控制逻辑都作相应的处理。
在识别精度要求高的场景中,应该采用“触发识别”模式。原因是: (1)用户在每次按键后,精神处于最集中的状态,此时用户说的语音命令会比较认真、清晰。避免了用户过时随意的发音导致的识别误差。
(2)每次按键后,产品应该给以一个明显的开始信号,比如发出“当”的一声或者其他提示信号,可以给用户一个明确开始的提示,方便用户掌握说语音命令的时间。
(3)由于按键触发后,用户就会贴近麦克风并说出语音命令,避免了其他环境声音被录入LD 3320芯片导致的误识别,这种方式还是一种省电的方式,在不识别时,彻底不让芯片工作以省电。
3、口令触发模式
在一些应用场合,希望识别精度高,但是又无法要求用户每次都用手按键来“触发识别”。此时,可以采用“口令触发模式”。
产品定义一句短语,作为触发口令。比如,可以定义“你好”作为触发口令。产品在等待用户触发时,启动一个“循环识别”模式,把触发口令“你好”和其他几十个用来吸收错误的词汇设置进LD 3320。只有当检测到识别出的结果是触发口令时,才认为是终端用户叫了这个口令。此时,给出提示音,并启动一个“触发识别模式”,并把相应的识别列表设置进LD 3320,提示用户在提示音后几秒钟内说出要执行的操作。
在等待用户的过程时,如果识别的结果是那些用来吸收错误的词汇,则认为是误识别,或者其他的声音干扰,而不进行任何的处理,直接再次进入“循
15