本科生毕业论文(设计)
中文题目:基于GMM说话人识别系统软件设计on GMM
学生姓名:虢明 班级: 7班 学号: 52070724 学 院:通信工程学院 专 业:信息工程 指导教师:王金芳 职称: 副教授
英文题目:Software design of speaker recognition system based
基于GMM说话人识别系统软件设计
学 生 姓 名:虢明 班 级:7班 学 号:52070724 学 院:通信工程学院 专 业:信息工程系 指 导 教 师:王金芳(副教授)
摘 要
摘 要
语音是实现人们之间沟通的最直接与方便的手段,而实现人与计算机之间畅通无阻的交流一直是人们努力的目标。随着信息技术的发展,计算机的应用日新月异,随着时代的前进,说话人识别技术也要求用计算机来处理。说话人识别技术是一种从语音数据中提取出能反映说话人生理和心理特征参数,并用这组特征参数来鉴别说话人身份的技术。一段语音数据中包含了太多的信息,而说话人识别的一项目标就是从语音信号中提取出反映说话人特征的参数。本文详细写出了说话人识别技术中应用得比较多的参数——梅尔倒谱特征参数(MFCC)的提取过程。说话人识别分为训练和测试两部分,本文的说话人识别模型采用的是高斯混合模型(GMM)。文章中详细说明了高斯混合模型的训练方法和说话人识别时的模式匹配。本文利用VC++6.0平台设计并编写了说话人识别软件,软件功能有语音文件的读取、语音信号的预处理、提取语音信号中的梅尔倒谱特征参数、高斯混合模型的训练以及说话人测试等。
在现实中,不可避免的语音信号会受到噪声的影响,语音噪声主要有信道中的卷积失真和加性噪声,本文介绍了这两种噪声的处理方法。
梅尔倒谱特征参数利用了听觉原理和倒谱的解相关特性,梅尔倒谱也具有对卷积性信道失真进行补偿的能力,由于这些特征,梅尔倒谱特征被认为是在语音相关识别任务中应用最成功的特征描述之一。高斯混合模型以其灵活、有效和对噪声的鲁棒性得到了人们越来越多的应用。
关键词: 说话人识别 Mel倒谱特征参数 高斯混合模型 Mel滤波器组 软件设计
1