论文部分内容阅读
随着社会的进步和计算机技术的发展,说话人识别作为身份鉴别技术的一种,由于其独到的优势得到越来越广泛的使用。在说话人识别领域中,与文本无关的说话人确认技术是目前的研究热点与难点。特别是近年来,背景噪声、传输信道复杂化和话筒等终端设备类型多样化导致了话者确认系统性能难以进一步提升。本论文围绕说话人确认的特征域补偿方法,从通道失配补偿、辅助特征参数补偿角度出发,提出了一些新的方法,并完成了相关实验。本论文主要研究内容有:1.探讨了倒谱分析、短时声道参数MFCC的提取过程,深入了解了GMM的组成原理、初值计算方式、EM训练方法、背景噪声模型UBM和说话人模型的MAP自适应方法。构建了基于GMM-UBM架构的说话人确认系统,并在给定的数据库上测试系统性能,针对MAP自适应算法调整不同类型参数对系统性能的影响进行了实验研究。2.深入研究了无监督特征映射通道失配补偿方法。利用主成分分析方法对男性和女性语音进行研究,研究发现异性语音在均值超矢量空间上距离较远,并由此提出了一种新的基于盲通道聚类的特征映射方法。该方法充分利用了异性语音在说话人空间上的差异性,解决了不充足语料情况下无监督特征映射问题。用此方法在均值超矢量空间对语音实现通道失配补偿,实验表明,该方法克服了语料不充足的劣势,相对主系统性能得到了提升。3.研究了自相关基频特征参数的提取方法,用带通滤波法可以有效减少共振峰对基频提取效果的干扰。深入探讨了语音学软件Praat中的改进自相关方法。在传统线性评分融合的基础上,提出了一种利用阈值进行评分融合的新方法。对大量错误测试和正确测试评分进行统计分析,论证了该方法的可行性,并提出了阈值取值范围的估算方案。实验表明,这种新的系统融合方案保护了较好的评分分布,使得基频特征辅助系统能够更好地补偿主系统的性能。