【摘 要】
:
语音模仿是指为了达到伪装另一个人的目的对其声音和发音习惯的再现,一个成功的模仿者能够找到、选择并模仿目标说话人最典型的声音特征。当蓄意模仿者模仿的声音与目标说话
论文部分内容阅读
语音模仿是指为了达到伪装另一个人的目的对其声音和发音习惯的再现,一个成功的模仿者能够找到、选择并模仿目标说话人最典型的声音特征。当蓄意模仿者模仿的声音与目标说话人的声音的相似度超过了声音认证系统的鉴别能力时,将会给声音认证系统的安全带来严重的威胁。因此进行了语音反蓄意模仿的研究,以减少语音蓄意模仿对声音认证系统的破坏。 本文对反蓄意模仿的语音增强、特征参数进行了研究,并实现了基于SVM的反蓄意模仿说话人识别系统,主要内容如下: 1、建立了反蓄意模仿语音库。 2、提出了基于TEO的语音活动检测的谱减法,该方法利用TEO对带噪语音进行语音活动检测,区别出噪声段和语音段,对噪声段和语音段分别进行谱减处理。经过实验验证,基于TEO的语音活动检测的谱减法语音增强效果明显,保证了语音质量,减少了音乐噪声,为反蓄意模仿说话人识别的研究打下了良好的基础。 3、针对常用的特征参数,采用主观评价与特征参数欧氏距离对比的方法,研究了基音、LPCC、MFCC和MFCC及其差分倒谱特征参数对语音蓄意模仿的区分性能以及对语音蓄意模仿相似程度的描述能力,实验证明 MFCC及其差分倒谱特征参数性能最好。 4、基于SVM建立了反蓄意模仿说话人识别系统,并与传统的VQ说话人确认系统的性能进行对比,实验证明本文建立的系统具有更好的性能。
其他文献
入侵检测作为一种主动的信息安全保障措施,能根据入侵行为的踪迹和规律发现入侵行为,从而有效地弥补了传统安全防护技术的缺陷,成为防火墙之后的又一道安全防线。 本文首
近年来,随着互联网及信息化技术的不断发展,3G无线传输技术与计算机信息技术相结合的应用越来越普遍,并为设备远程监测技术的发展创造了条件。特别是“十二五”规划中“全面提高
网格技术及其基础设施可实现不同组织内部及彼此之间的资源和服务的高度集成,它可以为高性能计算和问题解决带来新的方法和途径。国家自然科学基金“AMS数据计算环境的研究与
本文将围绕节能这一主题,在一些与节能问题密切相关的算法和协议上展开研究。研究的侧重点选择在拓扑管理技术,路由和自组织技术以及拥塞控制与速率控制机制等方面。论文中的工
本文对家庭网络结构进行了深入的探讨和剖析,阐述了“863”计划设计的家庭网络核心SoC平台的整体框架结构,分析比较了各种无线家庭网络协议,鉴于蓝牙技术巨大的市场支持力和
众所周知,人类感知的大部分信息是通过视觉获得的,而且在真实的世界里,人所感受到的是三维信息,如何更好得表现这些三维信息,一直是一个研究热点。三维重建正是在此种情况下
PDF文档应用范围十分广泛,数量极其巨大,而且PDF的应用仍然处于继续发展的状态,它在不断地被更多的用户所接受和采纳。PDF应用的广泛性和它继续蓬勃发展的状态与对PDF文档的有效
本文主要创新点如下: (一)提出下一代网络中作为业务提供环境的应用服务器多级分布式体系结构和一种Parlay业务逻辑的多级模块状态机,该状态机能基于用户信息交互功能的动态
现代许多工业检测以及建模技术中,常常需要对物体的三维信息或者相关的物理量,比如物体的空间位置,形状,尺寸,位移,形变等参数进行测量。视觉坐标测量作为一种立体视觉和光学
入侵检测技术能够根据入侵行为的踪迹和规律发现入侵行为,是一种主动的网络安全保障措施。本文在分析比较了基于数据挖掘的入侵检测方法的基础上研究组合核聚类分析和序列分