论文部分内容阅读
随着信息技术和网络通信的发展,整个人类社会进入了信息化时代,需要面对一个很重要的问题——信息安全。身份鉴别是信息安全的重要部分,它影响着我们生活的各个领域。声纹和指纹、人脸、DNA一样,是一个人内在的、唯一的特征,通过提取声纹中的特征来进行身份鉴别的技术不断地发展起来,引起了许多国内外学者的研究。声纹识别技术研究的关键是语音信号的前端处理、特征提取、建模方法以及抗噪声等问题。本文主要针对以上问题,展开了相关的研究。首先,为了减小噪声信号的干扰,提高语音信号的信噪比,研究了声纹识别语音信号的预处理方法,分析了谱减法语音增强算法,并对谱减法进行了改进,重点提出了基于递推最小二乘法(RLS)的自适应滤波语音增强算法,仿真实验结果表明,RLS自适应滤波的语音增强效果更好。然后,对声纹识别中语音信号的特征提取做了详细研究,描述了特征参数共振峰、线性预测倒谱系数(LPCC)、梅尔频率倒谱系数(MFCC)的提取方法,重点分析介绍了基于人耳耳蜗模型的Gammatone频率倒谱系数(GFCC),提出了特征参数GFCC的提取算法,并通过仿真实现了共振峰、LPCC、MFCC、GFCC的提取。其次,为了提高声纹识别系统的鲁棒性和识别率,研究了高斯混合模型(GMM)的模型参数估计期望最大化(EM)算法及初始化的方法,详细阐述了GMM的训练、识别方法。进而通过仿真实验深入研究了基于GMM的声纹识别系统在不同特征参数维数、不同模型混合数以及不同信噪比环境下的实验效果,比较了不同维数的特征参数LPCC、MFCC、GFCC的性能、不同GMM混合数的性能。此外,在不同信噪比下,本文提出了基于GFCC与RLS自适应滤波语音增强算法相结合的声纹识别算法。实验结果表明,在不同信噪比下,特征参数GFCC具有抗噪声能力,能提高语音信号的可懂度和清晰度,比MFCC具有更好的识别性能和鲁棒性;并且特征参数GFCC与RLS自适应滤波语音增强算法相结合的声纹识别系统,识别率能达到90%以上,识别性能优于改进谱减法与MFCC相结合的识别算法。最后,本文对研究中的成果进行了总结分析,并对研究中的不足之处做了详细说明,进而提出了未来的研究方向。