数字语音识别小程?/p>
摘要?/p>
通过提取声音信号?/p>
MFCC
作为特征?/p>
利用动态时间规整技术实现匹配算法,实现?/p>
特定人孤立汉语数字语音的识别,并利用
Matlab
编写了简单的图形用户界面?/p>
关键词:
语音识别?/p>
MFCC(
梅尔频率倒谱系数
)
?/p>
DTW(
动态时间规?/p>
)
一?/p>
MATLAB
简?/p>
MATLAB
是一种功能强大、效率高、交互性好的数值计算和可视化计算机高级语言?/p>
它将数值分析?/p>
信号处理和图形显示有机地融合为一体,
使得技术人员可以在较短的时间里
对自己的想法进行实验验证?/p>
?/p>
MATLAB
基础上进行汉语数字语言识别的图形用户界面开?/p>
与程序设计的?/p>
二、语音识别系统的本质
语音识别系统本质上是一种模式识别系统,
它包括了特征提取?/p>
模式匹配?/p>
参考模型库
这三个基本单元。典型系统的基本结构如图
1
所示?/p>
?/p>
1
典型语音识别系统
目前常用的技术有特征参数匹配法?/p>
隐马尔科夫法和神经网络法?/p>
其中语音特征参数?/p>
以是能量、基音频率、过量率、共振峰值等,目前常用的参数为基于发声声道特征模型,?/p>
过线性预测分析的线性预测倒谱系数
LPCC
和基于人耳的听觉机理,反映听觉特性,模拟?/p>
耳对声音频率感知的梅尔倒谱系数
MFCC
等?/p>
MFCC
的频率特性反映了人耳的听觉特性,
因而在用于代替人耳来分析语音时?/p>
?/p>
LPCC
相比,不依赖于全极点语音产生模型的假定,抗噪能力较强。所以使?/p>
MFCC
参数作为语音
识别的主要特征参数?/p>
三、语音信号的分析与处?/p>
1
信号采集
本实验直接用电脑的声卡进行语音信号的数字化采样量化处理。采?/p>
Matlab
?/p>
audiorecorder
对象进行声音信号采集?/p>
使用默认参数
8kHz
采样率,
8
位量化精度,
单声道?/p>
2
预加重处?/p>
因为发声过程中声带和嘴唇的效应,
使得高频共振峰的振幅低于低频共振峰的振幅?/p>
?/p>
行预加重的目的就是为了对信号进行平滑?/p>
提升高频部分?/p>
补偿声带和嘴唇的效应?/p>
平坦?/p>
号频谱,保持整个频带中的信噪比,以便于进行频谱分析或声道参数分析?/p>
语言信号
预处?
特征提取
模式识别
模型?
语音输入
识别
?/p>
?
识别结果