语音信号处理 吉林工程技术师范 D0942

目 录

第一章 绪论 ........................................... 1 第二章 基本理论........................................ 2 2.1语音信号加窗处理................................. 2 2.2短时时间域分析和短时频率域分析 ................... 3 2.3 LPC参数估计 .................................... 4 第三章 语音信号处理GUI设计 ............................ 5 3.1 GUI界面功能介绍................................. 5 3.2 GUI界面的具体操作 ............................... 6 3.3 GUI设计窗口的基本操作 ........................... 6 第四章 总结 .......................................... 12 参考文献 ............................................. 13

第一章 绪论

语音信号处理是研究数字信号处理技术和语音信号进行处理的一门学科,是一门新型的学科,是在多门学科基础上发展起来的综合性技术,它涉及到数字信号处理、模式识别、语言学。语音信号处理是研究用数字信号处理技术对语音信号处理的一门学科。处理的目的是要得到一些语音参数以便高效的传输或存储;或者是通过处理的某种运算以达到某种用途的要求。语音信号处理又是一门边缘学科。如上所诉,它是“语言语音学”与“数字信号处理”两个学科相结合的产物。

语音信号处理属于信息科学的一个重要分支,大规模集成技术的高度发展和计算机技术的飞速前进,推动了这一技术的发展。在数字音频技术和多媒体技术迅速发展的今天,传统的磁带语音录放系统因体积大、使用不便、放音不清晰而受到了巨大挑战。本次课程设计提出的体积小巧,功耗低的数字化语音存储与回放系统,可以有效的解决传统的语音录放系统在电子与信息处理的使用中受到的限制。

本次课程设计是用 MATLAB 对含噪的语音信号同时在时域和频域进行滤波 处理和分析,在 MATLAB 应用软件下设计一个简单易用的图形用户界面 (GUI) ,来解决一般应用条件下的各种语音信号的处理。

而本论文提出了语音信号处理课程建设的实验环节中的一些考虑,作为专业课程的学习,实验内容不能仅仅停留在验证性实验上,还应增加实验延伸的设计要求,是学生加深对理论分析认识的同时,强调培养学生的实际动手能力和知识综合运用能力。从而提高语音信号的教学和实验的质量。实验内容采用MATLAB编程实现,不仅易于语音信号处理的实现,更易引导学生完成实验延伸的设计。

吉林工程技术师范学院课程设计论文

第二章 基本理论

语音检测算法是现在语音信号处理研究的一个热点。近些年来,语音信号处理技术伴随着人们对通讯技术升级的需求得到了迅猛的发展。IP电话已经走向大规模产业化应用,并以其低廉的成本和满意的话音质量成为通讯供应商竞争的利器,大有取代传统电话的趋势。

语音识别技术也已经实现了与说话者无关的大词汇量连续语音识别,并试图从试验研究走向商用。说话者识别技术作为一个新一代的门禁安防技术也已经出现商业应用。很多单工的通讯设备可以通过语音检测技术的应用实现收发状态的自动转换而以比较小的代价达到双工设备的功能。语音检测技术作为这些语音处理算法中的核心预处理单元,成为这些技术能否走向成熟商业应用的关键技术之一。 实际通讯环境中会遇到各种不同类型、不同强度的噪声。它们各自在时域或频域中有互不相同的特点,没有一致的统计参数。

语音信号本身也是一个时变的复杂信号。不同的语言,不同的音位(语音中的最小发声单位)各不相同。总之,实际中的噪声和语音信号都是复杂的时变信号。如果不是面向特定背景噪声的应用,通过寻找噪声的共同特征以构建一个噪声信号与语音信号的区分函数是不现实的。 语音信号处理本身是一个涉及到传统数字信号处理、统计信号处理、模式识别与建模、发声学、语音语言学等多学科的综合技术。论文在前人研究的基础上,从语音信号的形制机理出发,对语音信号中的基本成分—轻音和浊音的特征进行了深入的研究。Source-Filter模型在语音信号建模中有着广泛的应用,论文在基于Source-Filter模型求取语音信号的LPC谱中发现,语音的短时稳定性(short time stationary)在LPC谱中有着不同于噪声信号的鲜明体现,从而提出了基于音位共振峰轨迹跟踪的语音检测新方法。论文对新算法与国际电信联盟(ITU)的G729B推荐语音检测标准算法进行了对比验证,证明在强背景噪声环境下新算法的性能有20%左右的提高。同时新算法也体现出比G729B更强的背景噪声适应能力。

2.1语音信号加窗处理

由于发音器官的惯性运动,可以认为在一小段时间里(一般为10ms~30ms)

语音信号近似不变,即语音信号具有短时平稳性。这样,可以把语音信号分为一些短段(称为分析帧)来进行处理。 加窗常用的两种方法:

1.矩形窗,窗函数如下:

?1 0?n?N?1w(n)???0 其它 (2-1)

2.汉明(Hamming)窗,窗函数如下

? 0?n?N?0.54?0.46 cos ??2πn/?N?1??? , w(n)????0 其它 (2-2) 窗长的选择一般选取100~200。原因如下:

当窗较宽时,平滑作用大,能量变化不大,故反映不出能量的变化。

2

联系客服:779662525#qq.com(#替换为@) 苏ICP备20003344号-4