带噪语音条件下声纹识别的优化

来源 :北京林业大学 | 被引量 : 0次 | 上传用户:nc_xujian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
声纹识别又叫说话人识别,作为一种人工智能技术,它慢慢从研究走进了人们的生活,给人类带去便利。由于声纹识别的性能会受到噪声的干扰,因此,在实际应用中,其性能并不能达到像纯净语音那样的识别效果。据前期研究,噪声对不同模型的声纹识别都具有不同程度的影响。不同的噪声可使声纹识别的等错误率提升至原来的1.2~4倍不等。由此可见,噪声是影响识别结果的关键因素之一。因此,解决噪声对声纹识别产生的干扰问题是一项很有意义的研究工作。当前,针对提高噪声条件下声纹识别效果的研究,大致有三种研究思路:(1)对带噪声的语音进行抗噪处理;(2)研究更具有抗噪特性的声纹特征;(3)数据增强和优化声纹识别的模型结构。本文将从方法1和方法3入手,改进现有的声纹识别技术框架,提高噪声条件下声纹识别的效果。在语音抗噪方面,从用于分离多说话人语音的PIT系统中提取基本结构,用于语音的抗噪。做数据增强时,本文尝试了三种方式,以便更好地提高模型的抗噪能力。在声纹识别模型方面,对比多种模型后,本文选择了可以考虑到上下文影响的LSTM作为识别模型,并在模型中加上Attention机制,以探究其对模型鲁棒性的影响;损失函数选择效果较好的GE2E损失函数。实验结果表明,改进后的模型对噪声条件下的声纹识别效果有所提升,等错误率下降了 60%~70%。
其他文献
能源危机和环境污染是人类社会可持续发展中所面临的两个重大战略问题。只有发展清洁能源和可再生能源,才可以从根本上解决化石能源如煤、石油、天然气等的日益枯竭以及在使
目的 观察青蒿琥酯诱导白血病细胞株K562和多药耐药白血病细胞株K562/DOX凋亡以及青蒿琥酯增加阿霉素抗K562/DOX细胞活性,并初步探讨其作用机制,为临床应用青蒿琥酯治疗白血病提
前言:恶性肿瘤是机体自身细胞在各种内外致癌因素作用下发生恶性转化而发生的,它与机体免疫系统的关系十分复杂。由于肿瘤细胞表面存在着可被机体识别的肿瘤抗原,所以可以引起一
信息科技的发展日新月异,人们对通信系统的要求日益增长,射频系统器件数量、现代通讯电子设备数量均有大幅度提升,通信系统承载空间不足的问题也越来越受到国内外研究人员的
世界金融界对商业银行风险安全管理由来已久。2004年《新巴塞尔资本协议》,提出实行以最低资本要求、央行监管、市场纪律三大支柱为特点,以信用风险、市场风险及操作风险管理
二次函数是初中数学数与代数课程领域的重要内容,它是客观地反映现实世界中变量之间的数量关系和变化规律的一种非常重要的数学模型,它承载着数形结合、分类讨论、化归与转化
目的: 研究选择性环氧化酶—2(cox-2)抑制剂nimesulide对胃癌细胞SGC-7901增殖的影响;胃癌及癌旁组织的凋亡率:cox-2、Fas、FasL、Bcl-2、NF-κB在胃癌及癌旁组织的表达及其相
近年来,基于计算机视觉的非接触式结构振动测量方法以其方便高效的特点成为结构健康监测领域的热点。传统的振动监测方法相对成本较高,且空间测点有限。基于计算机视觉的非接触式振动测量价格相对低廉、精度高,可以实现远程全场测量,在实际工程中发挥挥着越来越大的作用。因此,本文研究基于计算机视觉的结构振动测试与模态参数识别的方法。本文主要研究内容包括:研究了视频运动放大技术的基本原理,包括欧拉影像放大法、基于相
超疏水表面指的是液滴接触角大于150度同时滚动角小于10度的表面。超疏水表面具有流体减阻、防冰、自洁净和表面缓蚀等特点。所以超疏水表面的应用在生活、生产、医学等各种
高温金属件的测量环境及其复杂,使传统的接触式测量方法失效,而基于结构光的非接触式测量方法是解决上述难题的一个重要方向。该测量技术存在三个技术难点:第一是高温热辐射