基于深度学习的欺骗性语音检测研究

来源 :广东技术师范大学 | 被引量 : 0次 | 上传用户:dillydally
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
欺骗性语音是指利用伪装手段制作的非原始且带有欺骗目的性的语音,主要分两类:1)没有目标识别人的语音变形(Voice Transformation,VT);2)有目标识别人的语音转换(Voice Conversion,VC),语音合成(Speech Synthesis,SS)以及重播攻击。欺骗性语音会对已广泛使用的说话人识别系统(Automatic Speaker Recognition,ASR)造成极高的错误接受率或极高的错误拒绝率,从而危害社会安全。因此,研究欺骗性语音的检测具有重要意义。目前已有的研究一般都分为特征提取和分类识别两部分,且大多都采用传统机器学习的识别方法,需要人工提取特征,影响欺骗性语音检测的效果。鉴于深度学习框架具有自动提取深度特征的功能,本文研究基于深度学习的欺骗性语音的检测算法。主要工作包括:1.提出基于密集卷积神经网络(Dense Convolutional Network,Dense Net)的VT欺骗性语音检测算法。所提出的模型结构是在卷积神经网络的基础上改进得到的,依据语音信号的时频特征进行特殊设计。模型总共包含135层的网络层,能够利用深层的特征,从而进一步地提高检测的精度。实验结果表明该算法对不同欺骗因子下的VT欺骗语音的检测精度超过了98%。并且,加入噪声及经过语音压缩的语音检测精度均依旧保持在90%以上,具有良好的鲁棒性和抗干扰能力。2.提出基于长短时记忆网络(Long Short-Term Memory,LSTM)的端到端的欺骗性语音检测算法。所提出的CNN-LSTM网络结构是由卷积层以及LSTM层组成的,采用端到端的检测方法,语音数据可直接输入网络而不需要加入任何的先验知识,最大化地保留了语音的有效信息。实验结果表明CNN-LSTM无论是在长语音还是短语音上检测进度都超过95%,具有很好的检测效果。综上所述,本文对两种欺骗性语音的检测进行了理论和方法的研究,可作为ASR系统的前置或后置模块,以检测欺骗语音,增强ASR的鲁棒性,对语音信息安全研究具有重要的理论和应用价值。
其他文献
本文研究了在调制的zeta势和调制的滑移边界条件下牛顿流体的磁流体电渗流在平行板微管道中的速度场和流场.流动的驱动机制源于外部强加的电场E_x产生的电场力和电场E_y与磁
随着现代通信方面技术的日益发展,信息的传输速度变得越来越快速,信息的安全传输成为许多人关注的焦点。光学加密系统由于其加密原理简单、操作过程方便、安全性较高等特点得
目的:本研究以NUP62作为研究对象,旨在检测其在胃癌和癌旁组织及各胃癌细胞系中的表达变化,探索NUP62在胃癌发生发展中的作用机制,希望为胃癌的研究提供新的理论和研究基础,并且为胃癌诊断治疗及预后提供新的靶点。方法:1、运用GCBI数据库检测目的基因在胃癌组织与相应癌旁组织中mRNA表达差异,运用Kaplan-Meier分析其在胃癌中表达量与患者预后的关系;2、免疫组织化学技术检测胃癌组织及其相
食管是炎症和肿瘤发生的常见部位,由于其前期病症不明确且不易被检测,通常病情发现已是中晚期,大大增加了后续治疗难度,因此食管疾病的早期诊断与干预十分必要。光学相干层析
现如今,社会步入高度发达的信息交互时代,图像已成为人们传递信息的重要载体,信息交互的需求激发了人们对图像质量的追求。然而,在获取或处理图像信息的过程中,往往会受到诸
腹主动脉瘤是腹部主动脉血管的扩张性疾病,其发展结果是瘤体逐渐增大并最终破裂,破裂死亡率高达90%。临床上,支架介入手术是治疗该疾病的有效手段。该手术需要临床医生准确把
汽车保险盒是汽车载体中重要的电子控制单元之一,它的主要作用是确保汽车电路的安全运行,避免汽车载体电路在发生电流异常时损坏汽车中的电子设备。根据汽车保险盒的组成结构
现在已经进入全球经济一体化时代,随着一体化程度不断深入,企业之间的竞争已经从传统的价格、品质等单一元素竞争上升到供应链层面的竞争。库存在整个供应链活动中的地位极其
锰过氧化物酶(Manganese peroxida,MnP)是木质素降解的关键酶之一,底物专一性弱,具有氧化降解各类芳香族化合物的独特能力,在木质素降解、染料脱色等方面取得了较多的研究与应
同时包含空间选择性衰落、时间选择性衰落和频率选择性衰落的信道叫做空时频选择性信道。空时频选择性信道因其信道复杂性而受到人们的关注,高速移动无线通信信道和水声通信