新建
上传
首页
助手
最?/div>
资料?/div>
工具

数字语音识别小程?/p>

 

摘要?/p>

通过提取声音信号?/p>

MFCC

作为特征?/p>

利用动态时间规整技术实现匹配算法,实现?/p>

特定人孤立汉语数字语音的识别,并利用

Matlab

编写了简单的图形用户界面?/p>

 

关键词:

语音识别?/p>

MFCC(

梅尔频率倒谱系数

)

?/p>

DTW(

动态时间规?/p>

) 

一?/p>

MATLAB

简?/p>

 

MATLAB

是一种功能强大、效率高、交互性好的数值计算和可视化计算机高级语言?/p>

它将数值分析?/p>

信号处理和图形显示有机地融合为一体,

使得技术人员可以在较短的时间里

对自己的想法进行实验验证?/p>

?/p>

MATLAB

基础上进行汉语数字语言识别的图形用户界面开?/p>

与程序设计的?/p>

 

二、语音识别系统的本质

 

语音识别系统本质上是一种模式识别系统,

它包括了特征提取?/p>

模式匹配?/p>

参考模型库

这三个基本单元。典型系统的基本结构如图

1

所示?/p>

 

 

?/p>

1 

典型语音识别系统

 

目前常用的技术有特征参数匹配法?/p>

隐马尔科夫法和神经网络法?/p>

其中语音特征参数?/p>

以是能量、基音频率、过量率、共振峰值等,目前常用的参数为基于发声声道特征模型,?/p>

过线性预测分析的线性预测倒谱系数

LPCC

和基于人耳的听觉机理,反映听觉特性,模拟?/p>

耳对声音频率感知的梅尔倒谱系数

MFCC

等?/p>

 

MFCC

的频率特性反映了人耳的听觉特性,

因而在用于代替人耳来分析语音时?/p>

?/p>

LPCC

相比,不依赖于全极点语音产生模型的假定,抗噪能力较强。所以使?/p>

MFCC

参数作为语音

识别的主要特征参数?/p>

 

三、语音信号的分析与处?/p>

 

1 

信号采集

 

本实验直接用电脑的声卡进行语音信号的数字化采样量化处理。采?/p>

Matlab

?/p>

audiorecorder

对象进行声音信号采集?/p>

使用默认参数

8kHz

采样率,

8

位量化精度,

单声道?/p>

 

2 

预加重处?/p>

 

因为发声过程中声带和嘴唇的效应,

使得高频共振峰的振幅低于低频共振峰的振幅?/p>

?/p>

行预加重的目的就是为了对信号进行平滑?/p>

提升高频部分?/p>

补偿声带和嘴唇的效应?/p>

平坦?/p>

号频谱,保持整个频带中的信噪比,以便于进行频谱分析或声道参数分析?/p>

 

语言信号

预处?

特征提取

模式识别

模型?

语音输入

识别

?/p>

?

识别结果

Ͼλ
新建
上传
首页
助手
最?/div>
资料?/div>
工具

数字语音识别小程?/p>

 

摘要?/p>

通过提取声音信号?/p>

MFCC

作为特征?/p>

利用动态时间规整技术实现匹配算法,实现?/p>

特定人孤立汉语数字语音的识别,并利用

Matlab

编写了简单的图形用户界面?/p>

 

关键词:

语音识别?/p>

MFCC(

梅尔频率倒谱系数

)

?/p>

DTW(

动态时间规?/p>

) 

一?/p>

MATLAB

简?/p>

 

MATLAB

是一种功能强大、效率高、交互性好的数值计算和可视化计算机高级语言?/p>

它将数值分析?/p>

信号处理和图形显示有机地融合为一体,

使得技术人员可以在较短的时间里

对自己的想法进行实验验证?/p>

?/p>

MATLAB

基础上进行汉语数字语言识别的图形用户界面开?/p>

与程序设计的?/p>

 

二、语音识别系统的本质

 

语音识别系统本质上是一种模式识别系统,

它包括了特征提取?/p>

模式匹配?/p>

参考模型库

这三个基本单元。典型系统的基本结构如图

1

所示?/p>

 

 

?/p>

1 

典型语音识别系统

 

目前常用的技术有特征参数匹配法?/p>

隐马尔科夫法和神经网络法?/p>

其中语音特征参数?/p>

以是能量、基音频率、过量率、共振峰值等,目前常用的参数为基于发声声道特征模型,?/p>

过线性预测分析的线性预测倒谱系数

LPCC

和基于人耳的听觉机理,反映听觉特性,模拟?/p>

耳对声音频率感知的梅尔倒谱系数

MFCC

等?/p>

 

MFCC

的频率特性反映了人耳的听觉特性,

因而在用于代替人耳来分析语音时?/p>

?/p>

LPCC

相比,不依赖于全极点语音产生模型的假定,抗噪能力较强。所以使?/p>

MFCC

参数作为语音

识别的主要特征参数?/p>

 

三、语音信号的分析与处?/p>

 

1 

信号采集

 

本实验直接用电脑的声卡进行语音信号的数字化采样量化处理。采?/p>

Matlab

?/p>

audiorecorder

对象进行声音信号采集?/p>

使用默认参数

8kHz

采样率,

8

位量化精度,

单声道?/p>

 

2 

预加重处?/p>

 

因为发声过程中声带和嘴唇的效应,

使得高频共振峰的振幅低于低频共振峰的振幅?/p>

?/p>

行预加重的目的就是为了对信号进行平滑?/p>

提升高频部分?/p>

补偿声带和嘴唇的效应?/p>

平坦?/p>

号频谱,保持整个频带中的信噪比,以便于进行频谱分析或声道参数分析?/p>

 

语言信号

预处?

特征提取

模式识别

模型?

语音输入

识别

?/p>

?

识别结果

">
新建
上传
首页
助手
最?/div>
资料?/div>
工具

数字语音识别小程?/p>

 

摘要?/p>

通过提取声音信号?/p>

MFCC

作为特征?/p>

利用动态时间规整技术实现匹配算法,实现?/p>

特定人孤立汉语数字语音的识别,并利用

Matlab

编写了简单的图形用户界面?/p>

 

关键词:

语音识别?/p>

MFCC(

梅尔频率倒谱系数

)

?/p>

DTW(

动态时间规?/p>

) 

一?/p>

MATLAB

简?/p>

 

MATLAB

是一种功能强大、效率高、交互性好的数值计算和可视化计算机高级语言?/p>

它将数值分析?/p>

信号处理和图形显示有机地融合为一体,

使得技术人员可以在较短的时间里

对自己的想法进行实验验证?/p>

?/p>

MATLAB

基础上进行汉语数字语言识别的图形用户界面开?/p>

与程序设计的?/p>

 

二、语音识别系统的本质

 

语音识别系统本质上是一种模式识别系统,

它包括了特征提取?/p>

模式匹配?/p>

参考模型库

这三个基本单元。典型系统的基本结构如图

1

所示?/p>

 

 

?/p>

1 

典型语音识别系统

 

目前常用的技术有特征参数匹配法?/p>

隐马尔科夫法和神经网络法?/p>

其中语音特征参数?/p>

以是能量、基音频率、过量率、共振峰值等,目前常用的参数为基于发声声道特征模型,?/p>

过线性预测分析的线性预测倒谱系数

LPCC

和基于人耳的听觉机理,反映听觉特性,模拟?/p>

耳对声音频率感知的梅尔倒谱系数

MFCC

等?/p>

 

MFCC

的频率特性反映了人耳的听觉特性,

因而在用于代替人耳来分析语音时?/p>

?/p>

LPCC

相比,不依赖于全极点语音产生模型的假定,抗噪能力较强。所以使?/p>

MFCC

参数作为语音

识别的主要特征参数?/p>

 

三、语音信号的分析与处?/p>

 

1 

信号采集

 

本实验直接用电脑的声卡进行语音信号的数字化采样量化处理。采?/p>

Matlab

?/p>

audiorecorder

对象进行声音信号采集?/p>

使用默认参数

8kHz

采样率,

8

位量化精度,

单声道?/p>

 

2 

预加重处?/p>

 

因为发声过程中声带和嘴唇的效应,

使得高频共振峰的振幅低于低频共振峰的振幅?/p>

?/p>

行预加重的目的就是为了对信号进行平滑?/p>

提升高频部分?/p>

补偿声带和嘴唇的效应?/p>

平坦?/p>

号频谱,保持整个频带中的信噪比,以便于进行频谱分析或声道参数分析?/p>

 

语言信号

预处?

特征提取

模式识别

模型?

语音输入

识别

?/p>

?

识别结果

Ͼλ">
Ͼλ
Ŀ

语音识别小程?- 百度文库
新建
上传
首页
助手
最?/div>
资料?/div>
工具

数字语音识别小程?/p>

 

摘要?/p>

通过提取声音信号?/p>

MFCC

作为特征?/p>

利用动态时间规整技术实现匹配算法,实现?/p>

特定人孤立汉语数字语音的识别,并利用

Matlab

编写了简单的图形用户界面?/p>

 

关键词:

语音识别?/p>

MFCC(

梅尔频率倒谱系数

)

?/p>

DTW(

动态时间规?/p>

) 

一?/p>

MATLAB

简?/p>

 

MATLAB

是一种功能强大、效率高、交互性好的数值计算和可视化计算机高级语言?/p>

它将数值分析?/p>

信号处理和图形显示有机地融合为一体,

使得技术人员可以在较短的时间里

对自己的想法进行实验验证?/p>

?/p>

MATLAB

基础上进行汉语数字语言识别的图形用户界面开?/p>

与程序设计的?/p>

 

二、语音识别系统的本质

 

语音识别系统本质上是一种模式识别系统,

它包括了特征提取?/p>

模式匹配?/p>

参考模型库

这三个基本单元。典型系统的基本结构如图

1

所示?/p>

 

 

?/p>

1 

典型语音识别系统

 

目前常用的技术有特征参数匹配法?/p>

隐马尔科夫法和神经网络法?/p>

其中语音特征参数?/p>

以是能量、基音频率、过量率、共振峰值等,目前常用的参数为基于发声声道特征模型,?/p>

过线性预测分析的线性预测倒谱系数

LPCC

和基于人耳的听觉机理,反映听觉特性,模拟?/p>

耳对声音频率感知的梅尔倒谱系数

MFCC

等?/p>

 

MFCC

的频率特性反映了人耳的听觉特性,

因而在用于代替人耳来分析语音时?/p>

?/p>

LPCC

相比,不依赖于全极点语音产生模型的假定,抗噪能力较强。所以使?/p>

MFCC

参数作为语音

识别的主要特征参数?/p>

 

三、语音信号的分析与处?/p>

 

1 

信号采集

 

本实验直接用电脑的声卡进行语音信号的数字化采样量化处理。采?/p>

Matlab

?/p>

audiorecorder

对象进行声音信号采集?/p>

使用默认参数

8kHz

采样率,

8

位量化精度,

单声道?/p>

 

2 

预加重处?/p>

 

因为发声过程中声带和嘴唇的效应,

使得高频共振峰的振幅低于低频共振峰的振幅?/p>

?/p>

行预加重的目的就是为了对信号进行平滑?/p>

提升高频部分?/p>

补偿声带和嘴唇的效应?/p>

平坦?/p>

号频谱,保持整个频带中的信噪比,以便于进行频谱分析或声道参数分析?/p>

 

语言信号

预处?

特征提取

模式识别

模型?

语音输入

识别

?/p>

?

识别结果



ļ׺.doc޸Ϊ.docĶ

  • ¹˹ƷƼ
  • Уʦʸ֤--ߵȽѧ
  • 2018йȷƵҵ-гȵͶǰо(Ŀ¼)
  • ֯Ϊѧ(ver1.0)
  • PHPԾ2
  • ʵ߼·Ʒ
  • 紫word()11
  • ȳѵƬ۲
  • ҵʸ⼰
  • DSP28335I2CӿӦ

վ

԰ Ͼλ
ϵͷ779662525#qq.com(#滻Ϊ@)