基于文本无关的声纹识别算法的研究及实现

来源 :电子科技大学 | 被引量 : 6次 | 上传用户:huang267321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的迅猛发展,网络逐渐覆盖到了社会生活的各个角落。在互联网环境中,传统的身份认证方法面临巨大的挑战,越来越无法适应实际应用环境的需求。在所有的身份认证方法中,生物特征身份识别技术是一种基于人类特有的生理和后天特性进行的身份识别技术,因其独特的优势而在实际中得到了广泛的应用。在所有生物特征身份识别技术中,与文本无关的声纹确认技术被认为是最具实用性的生物特征身份识别技术之一,该技术通过目标说话人的语音对说话人的身份进行确认,是语音识别研究的一个重要分支。在实际应用环境中,受到采集设备、传输线路等多种因素的影响,最终得到的有效语音数据非常有限,进而使得系统的识别性能和执行效率很难达到理想的识别效果。因此,本文主要基于文本无关的短语音声纹确认方法进行研究。在声纹确认系统中,系统的识别率和计算复杂度是衡量系统性能的重要指标。传统的UBM-MAP-GMM模型架构在一定程度上解决了测试语音与训练语音失配的情况,系统识别性能也比较理想,然而在实际应用中,面对短语音问题,该模型的运算量需求较大,系统鲁棒性较差。因此,本文从减少系统计算量、提高识别率等多个角度出发对声纹识别算法进行了研究,具体有以下几个方面:1.分析了模型训练中模型初始值对EM算法的影响,针对传统K-means算法随机选择初始聚类中心可能导致算法局部收敛的缺陷,提出了基于密度和距离的初始聚类中心选择算法,对K-means算法进行了改进,并且通过实验证明了算法。2.探讨分析了UBM-MAP-GMM模型架构,针对其计算量大、个人声纹模型GMM服从同一模型结构及部分高斯分量对识别结果的影响,提出了基于UBM-CM-MAP-GMM模型架构的声纹确认方法。实验证明,该方法使得算法在识别时间、等错误率方面都有一定的改善。3.在UBM-CM-MAP-GMM模型架构中,对声纹模型GMM的混合度的取值进行研究,实验数据显示当GMM混合度为UBM的一半时效果最好。4.在UBM-CM-MAP-GMM模型架构上实现了短语音声纹确认软件,并对软件的识别效率进行了实验分析与验证,相比于传统的UBM-MAP-GMM模型架构,改进算法使得计算量和等错误率都一定程度的降低。
其他文献
为了提升对新农村桥梁的日常安全监理服务水平,方便管理者掌握农村桥梁的动态信息,常熟市农桥管理处拟建成“常熟市农桥管理地理信息系统”,希望通过该系统完成常熟市市级农桥基
随着计算机和网络技术的快速发展以及广泛应用,现代教育技术手段不断推陈出新,以弹性学习期限和交互式教学为主要特征的现代网络教学已经成为构筑信息社会终身学习体系的重要手
计算机化自适应测验(CAT)中具有智能的部分是选题策略,选题策略是CAT研究中最重要的部分。按CMT的功能来分,至少可以分为传统CAT与具有诊断功能的CAT。本文对传统CAT的选题策略和
图像显著区域的检测与提取是图像处理与计算机视觉的基本问题之一,是图像处理图像分析的关键步骤。对于图像的显著区域检测是十分有用的,如图像分割,自适应压缩,基于区域的图像检
神经网络一直以来都是学术界研究的热点,而伴随着图形硬件的更新换代,目前基于深度学习的神经网络再次在各个领域取得丰硕成果。然而这些人工神经网络处理信息时并没有完整的
近年来,随着社会城镇化和人口老龄化的逐步推进,城镇和农村居民就医难、就医手续繁琐等一系列问题不仅体现在医疗资源的匮乏和社会保障的缺少方面,而且在公共服务保障措施方面的
随着数码摄像设备如数码相机、智能手机的普及,数码图像数量极速增长,每天数以亿计的照片被上传到互联网。面对海量的图像数据,如何将海量图像数据进行存储以及如何对其进行
随着互联网的发展,网络已经融入到人们的工作和生活中,网络管理也得到了快速的发展,现在的网络管理在功能上越来越完善,但网络管理系统的操作也变得越来越复杂。本文采用层次化的
无线射频识别技术(RFID, Radio Frequency Identification)是一种无线通信技术,其碰撞问题日益得到关注。阅读器与标签之间能否正常通信,阅读器能否准确的读取标签的内容决定
本文首先介绍了压缩感知理论框架,着重回顾了压缩感知重构算法的研究和应用现状,针对其本质是l0范数问题,将对直线边缘稀疏表示性能好的脊波(Ridgelet)冗余字典和遗传进化(Ge