论文部分内容阅读
说话人识别作为生物识别认证技术中的一种,是指利用语音信号包含的信息进行特征提取,来辨别或确认说话人.随着互联网和信息技术的快速发展,说话人识别技术逐渐成为研究的一个热点内容.在众多的说话人识别方法中,本文重点研究了传统MFCC特征参数的改进方法并结合高斯混合模型的说话人识别系统,主要研究内容如下:1.系统介绍传统说话人语音识别系统的特征提取方法和模型建立技术,特征提取方法重点介绍了MFCC特征提取和LPCC特征提取;模型建立列举了动态时间规整、隐马尔科夫模型、高斯混合模型和人工神经网络.2.在传统MFCC特征参数算法的基础上,提出了加入端点检测算法,将采集语音中的静音段去除,通过缩短语音时长降低传统方法计算量大的弱点;并在此基础上,将三角滤波器组更换为高斯滤波器组,从而更有效地获到相邻子带之间的平滑过渡,提高识别的准确率.3.在使用高斯滤波器组改进传统MFCC算法的基础上,进一步提出利用基音频率动态改变高斯滤波器组中的控制方差,这一改变是通过引入新的线性映射方程,将每一帧语音信号中包含有说话人发音独特性的基音频率以线性映射的方式来动态改变高斯滤波器组的控制方差,构造出能够更好地代表不同说话人声带振动周期性特点的动态MFCC特征参数.实验结果表明,改进算法在识别率上有了很大提升,在说话人识别中具有很大的实用价值.4.本文统一选用高斯混合模型作为上下文无关的说话人识别模型,优点是能够利用多个高斯分布拟合不同说话人的特征向量分布空间,是说话人识别系统中最常使用的识别模型.经实验验证,本文改进的两种方法都能够在传统方法基础上提高识别率,具重要研究意义.