论文部分内容阅读
随着互联网技术的迅猛发展,网络逐渐覆盖到了社会生活的各个角落。在互联网环境中,传统的身份认证方法面临巨大的挑战,越来越无法适应实际应用环境的需求。在所有的身份认证方法中,生物特征身份识别技术是一种基于人类特有的生理和后天特性进行的身份识别技术,因其独特的优势而在实际中得到了广泛的应用。在所有生物特征身份识别技术中,与文本无关的声纹确认技术被认为是最具实用性的生物特征身份识别技术之一,该技术通过目标说话人的语音对说话人的身份进行确认,是语音识别研究的一个重要分支。在实际应用环境中,受到采集设备、传输线路等多种因素的影响,最终得到的有效语音数据非常有限,进而使得系统的识别性能和执行效率很难达到理想的识别效果。因此,本文主要基于文本无关的短语音声纹确认方法进行研究。在声纹确认系统中,系统的识别率和计算复杂度是衡量系统性能的重要指标。传统的UBM-MAP-GMM模型架构在一定程度上解决了测试语音与训练语音失配的情况,系统识别性能也比较理想,然而在实际应用中,面对短语音问题,该模型的运算量需求较大,系统鲁棒性较差。因此,本文从减少系统计算量、提高识别率等多个角度出发对声纹识别算法进行了研究,具体有以下几个方面:1.分析了模型训练中模型初始值对EM算法的影响,针对传统K-means算法随机选择初始聚类中心可能导致算法局部收敛的缺陷,提出了基于密度和距离的初始聚类中心选择算法,对K-means算法进行了改进,并且通过实验证明了算法。2.探讨分析了UBM-MAP-GMM模型架构,针对其计算量大、个人声纹模型GMM服从同一模型结构及部分高斯分量对识别结果的影响,提出了基于UBM-CM-MAP-GMM模型架构的声纹确认方法。实验证明,该方法使得算法在识别时间、等错误率方面都有一定的改善。3.在UBM-CM-MAP-GMM模型架构中,对声纹模型GMM的混合度的取值进行研究,实验数据显示当GMM混合度为UBM的一半时效果最好。4.在UBM-CM-MAP-GMM模型架构上实现了短语音声纹确认软件,并对软件的识别效率进行了实验分析与验证,相比于传统的UBM-MAP-GMM模型架构,改进算法使得计算量和等错误率都一定程度的降低。