论文部分内容阅读
说话人识别是语音信号处理技术的主要应用之一,也是生物特征识别领域的一个热点问题,对现有说话人识别系统存在问题的解决从根本上依赖于语音信号分析的成效。小波分析是近年来出现的新的时频局部化分析方法,具有其它方法无可比拟的诸多优点,能够更精细地描述语音信号,捕获其中重要的非平稳信息。基于此,本文主要对小波分析理论在说话人识别中的应用进行研究。首先,本文对小波分析理论进行了简要介绍,着重于论文所应用的小波变换的多分辨率分析技术及小波包变换的频带划分技术。其次,介绍了本文所采用的说话人识别模型(GMM模型)及使用的实验数据。在此基础上,采用MATLAB语言和VC++语言实现说话人辨认实验系统的设计,将其作为本文实验平台。本文对小波分析理论在说话人识别中的应用研究主要包括两个方面:探索小波语音增强方法在说话人识别中的应用及进行基于小波包变换的说话人特征参数的设计。具体内容如下:(1) 阐述了小波语音增强方法的原理,提出了一种新的小波语音增强算法,并研究其语音增强效果及在说话人识别系统的预处理过程中的应用。实验结果表明,这种方法不仅有明显的语音增强效果,且应用于噪声环境下的说话人识别系统时,能够提高系统的鲁棒性。(2) 对常用的说话人特征参数及其在说话人识别中的应用进行了总结,分析了它们存在的问题及解决方法。在此基础上,本文利用小波包的频带划分技术,仿照人类听觉系统特性,提出了一种Bark尺度小波包变换的分解结构。由于设计思路上的原因,这种分解结构不仅在感知特性上与人耳的听觉特性相吻合,而且参考了说话人特有信息的频带分布特点。本文将基于这种分解结构的Bark尺度小波包变换应用于说话人识别的特征提取过程。所构造的新特征与目前广泛使用的MFCC参数的对比实验表明,新特征具有更强的鲁棒性,可以提高说话人识别系统的性能。