康虹:基于单片机的语言控制小车设计
声,所以,滤噪便成为最为关键的技术。
声控技术虽然是一项比较先进的技术。但是,声控技术在无限传输时的合成的质量不是很好,它还需进一步提高,因为无线环境中的背景噪音太大了,当然还有其他方面的因素影响着声控功能的发挥,具体来说表现在以下几个方面:
1 、时效型。从发出指令到执行指令,有一段延迟时间,虽已降低到尽可能的小,但还是很明显。可行的方法就是改用高效的DSP芯片,这在经费上和时间上都是不允许的。
2.、对环境的适应。如果环境噪声很大,或偶尔出现较大的噪声,则会出现误识。这个不足之处还没有很有效的解决方案。
3、多人识别。各人的发音不尽相同,因此该系统还限于单人识别。若要做多人识别,则识别的时效性会降低,即有很大的延迟。另外,多人识别,也没有较为有效、成熟的算法供参考。
1.3 课题的目的任务和要求
声控小车其技术要求是通过相关语音对小车进行操作控制。使用了“前、后、左、右、停”五个字作为小车行驶的指令。本毕业设计有助于培养我们的独立动手能力、思考能力。具体的项目制作过程分为两部分:软件部分和硬件部分。其目的让我们熟悉61板的设计与制作,并掌握其原理;学会运用C语言进行编程且运用。
语音控制小车的主要功能:
1. 可以通过简单的I/O操作实现小车的前进、后退、左转、右转功能; 2. 配合SPCE061A的语音特色,利用系统的语音播放和语音识别资源,实现语音控制的功能;
3. 可以在行走过程中声控改变小车运动状态; 4. 在超出语音控制范围时能够自动停车。
- 2 -
华科学院本科毕业设计(论文)
第2章 语音小车的方案论证
2.1 语音控制方案
2.1.1基本原理
机器语音识别、处理的过程与人对语音识别、理解过程基本上是一致的,目前主流的语音识别技术是基于统计模式识别的基本理论。一个完整的语音识别系统可大致分为语音特征提取、声学模型与模式匹配(识别算法)和语义理解3部分。其基本原理如图2.1所示。
训练
语言输入 去噪端点检测特征提取参考模板参数修正模式匹配结果识别输出图2.1语音识别系统原理框图
从图中我们可以看出语音识别一般分为2个步骤:第一步是系统“学习”或“训练”阶段,这一个阶段的任务是建立识别基本单元的声学模型以及进行文法分析的语言模型,即构建参考模式库;第二步是“识别”或“测试”阶段,根据识别系统的类型选择能够满足要求的识别方法,采用语音分析方法分析出这种识别方法所要求的语音特征参数,按照一定的准则和测度与参考模式库中的模型进行比较,通过判决得出结果。
2.1.2语音识别系统的构成
语音识别系统的基本结构主要包括预处理、A /D转换、起止点识别、特征提取和识别判断等部分, 结构如下图2.2所示。
- 3 -
康虹:基于单片机的语言控制小车设计
话筒 预处理 A/D转换 特征提取 模板存储 起止点识别 识 别判断
图2.2语音识别系统的基本结构
2.2 方案论证
2.2.1 采用DSP+FPGA方案
语音识别根据实际需要和应用场合的不同,可以分为孤立词识别和连续语音识别、特定人识别和非特定人识别。语音识别追求的主要指标为高识别率、实时性和大词汇量;而对于一个语音识别系统,还应考虑软硬件设计简单、价格低廉、外围控制灵活、人机交互便捷等特点。现在应用于语音识别的芯片主要为DSP(数字信号处理器)芯片:如TI公司的TMS320系列。然而, 将DSP 芯片用于小型语音识别系统中, 其不足之处是很明显的:引脚多、 价格贵、 使用繁琐;控制功能弱,常需要与单片机或FPGA (现场可编程门阵列)结合, 来实现人机交互; 常需要外接A /D 转换芯片;引脚为3. 3 V,与单片机、FPGA、F lash 存储器等连接时,要考虑电平匹配。这些将使整个系统结构庞大,设计繁琐。 2.2.2采用MCS-51方案
采用 MCS-51 系列单片机实现,由于有语音识别和语音播放功能,所以需要扩展语音识别模块和语音播放模块,这样必然造成端口的资源紧张,所以还必须加入接口扩展芯片。该实现方案结构如图 2.3 所示。
- 4 -
华科学院本科毕业设计(论文)
IO MCS_51 接口扩展模块 接口总线 语音识别模块 语音播报模块 电机驱动模块
图2.3采用 MCS-51 系列单片机实现语音控制小车
2.2.3 采用凌阳61方案
SPCE061A是凌阳科技推出的一个16位结构的微控制器。CPU时钟频率为0.32~49.152 MHz,具有较高的处理速度,可使μ’n SPTM能够非常容易、快速地处理复杂的数字信号;拥有可编程音频处理;内置2 K Word的SRAM和32 K Word的FLASH;2个16位可编程定时器/计数器(可自动预置初始计数值),2个10位DAC输出通道,32位通用可编程输入/输出端口。它是数字语音识别应用领域产品中的一种比较经济的选择。
图2.4基于SPCE061A的语音控制小车实现方案
本案采用采用SPCE061A实现语音控制小车方案。 系统结构框图2.5如下:
- 5 -
康虹:基于单片机的语言控制小车设计
SPK MIC 61板 音频放大电路 语音输入电路 凌阳SPCE061A单片机 方向控控制电路 方向电机 驱动控 制电路 驱动电机 KEY
图2.5结构系统图
系统组成主要包括以下两部分:SPCE061A精简开发板、语音小车控制电路板。 图中的语音输入部分MIC_ IN、按键输入KEY、声音输出部分的功率放大环节等已经做到了精简开发板——61 板上,为我们使用提供了很大的方便。在电机的驱动方面,采用全桥驱动技术,利用四个I/O端口分为两组分别实现两个电机的正传、反转和停三态运行。
2.3 系统控制方案
小车的运动控制采用语音控制和中断定时控制相结合,通过语音触发小车动作,小车动作之后,随时可以通过语音指令改变小车的运动状态。在每一次动作触发的同时启动定
- 6 -