论文部分内容阅读
说话人识别是生物识别技术的一种,目前常用的说话人识别系统对纯净语音的说话人识别率已经达到很高的水平,但实际环境中无处不在的噪声带来了训练模型和测试语音之间的失配,使得噪声环境中说话人识别系统的识别率急剧下降。因而鲁棒性是影响说话人识别系统能否实用的一个关键问题,本文的研究重点是说话人识别系统的鲁棒性能,提高噪声环境下的说话人识别率。抗噪声说话人识别的目的是尽量减小或者消除噪声所带来的训练模型和测试语音之间的失配,从而提高含噪语音的说话人识别率。消除噪声所带来的失配可以映射到信号空间、特征空间和模型空间。本文重点研究基于高斯混合模型的说话人识别系统中具有鲁棒性的特征参数提取、含噪语音的增强二个关键技术,也就是从这信号空间和特征空间来进行研究。主要工作如下:1)提出了一种改进的Mel频率倒谱系数,记为:PL MFCC,并成功的将PLPCC用于说话人识别;研究PL MFCC、PLPCC、MFCC、LPCC及其一阶差分的性能,并研究动静态组合特征参数的抗噪性能;2)研究各种参数和基音组成联合特征参数的鲁棒性能;研究基音和共振峰及PLPCC组合成的组合特征参数的鲁棒性能。3)信号空间采用谱减法、wiener滤波法来增强语音,提高信噪比。实验表明上述的方法能不同程度的提高噪声环境下的说话人识别率。