基于移动终端的声纹识别系统关键算法研究

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:chenchenhao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
声纹识别技术是一种生物认证方法,它从说话人的语音中提取出能反映说话人生理和行为个性的特征,再结合模式识别的理论,来判断说话人身份。本文主要针对基于移动终端的声纹识别系统的相关技术进行了研究。在语音端点检测方面,本文提出了改进的能量-过零率两级融合端点检测法,该方法与传统的能量-过零率端点检测法不同,它可以将能量检测和过零检测分开操作,使这两种检测的结果同时进行又互不影响,从而实现多线程并行计算。此外,改进的能量-过零率端点检测法在检测中运用的是单门限,相对于传统算法,改进算法可将阈值参数减少一半,使算法过程更加简单。针对空间资源有限的移动终端,本文将改进算法与常用的单阈值能量检测法进行对比,发现运用改进算法的声纹识别系统的识别率更高。因此,改进的能量-过零率两级融合端点检测法在移动终端上具有很高的应用价值。针对传统语音帧投票法无法突出每一帧语音判决结果的差异性的问题,本文提出了基于似然概率的的加权投票法。此方法根据不同语音帧与概率模型之间的似然概率取值,对每一帧语音进行加权,使得似然概率大的语音帧权重更大,置信度更高,从而增强每帧语音判决结果之间的差异,使语音帧融合结果更准确。同时,通过多次的加权检测,本文验证了基于加权投票法的声纹识别系统比基于传统投票法的识别系统识别性能更优。最后,本文设计了多种特征提取技术以及概率模型的组合方案,通过实际识别效果和算法复杂度的角度来分析它们在移动终端上的可行性,选出最可行的方案。并且根据最优的声纹识别系统方案,设计了一种基于移动终端的声纹识别系统,并在MATLAB平台上实现了该系统,该系统可实现声纹采集、模型训练、声纹识别、声纹注册、声纹确认等功能。目前,该系统已经成功移植于Android系统当中。
其他文献
家庭基站(Femtocell)是根据近年来宽带移动化发展的趋势而得到广泛研究的一种超小型基站系统。主要是为家庭住宅和企业办公等室内场景的用户提供更好的服务质量。在由宏蜂窝
智能控制是当今控制领域中的热门研究内容,而在智能控制领域中,模糊控制系统占有重要地位。由于传统数学方法面向对象为精确数学模型,而自然界中实际控制问题有时并不能用传
短波通信具有机动灵活、抗毁性好等优点,一直是军事通信大力发展的通信技术。但由于传统短波通信功能单一、可扩展性差,已难以适应现代通信的数字化、网络化、宽带化等需求。
认知无线电技术实现了频谱资源的动态分配,提高了频谱资源的利用率,而准确高效的频谱感知是认知无线电的核心环节。快速高性能的频谱感知算法研究已经成为了一个亟待解决的问
  近年来,汽车工业已经成为世界的支柱产业,汽车在日常生活和工作中起的作用也越来越突出,车载导航系统正是在这样的背景下发展起来的一门新型技术,虽然功能繁多,但性能还
博弈论是一种研究自私个体间竞争以及合作问题的工具,分为非合作和合作博弈。非合作博弈的解“纳什均衡(NE:Nash Equilibrium)”,给出了自私个体在最大化自己效益的竞争过程
以电磁波为载体,雷达对感兴趣目标进行探测时,具有全天时、全天候、探测距离远、受环境依赖程度低等优势,有效的弥补了可见光、红外等光学手段对目标和环境信息感知能力的缺
主动配电网(Active Distribution Network,ADN)是在主配网的协同控制的基础上,能够通过分布式发电、储能技术以及需求侧响应等调控手段,针对电力系统实际运行状态进行自适应调节源、网、荷的配电网。ADN架构内的能量调控主要表现在配电网对大规模分布式能源(Distributed Energy Resource,DER)的接纳和利用进行主动调节和控制,而这一过程离不开高效实用的信
长非编码RNA(long non-coding RNA,lncRNA)是一类转录本长度大于200核酸的非编码RNA。随着高通量测序技术的广泛应用,已在生物体内发现大量lncRNA,其中有相当一部分的lncRNA
语音端点检测的目的是检测出语音信号中的语音与非语音片段。在很多先进的语音处理应用的前端处理部分,比如语音识别,声纹识别和语音传输,语音端点检测都是重要的步骤。在所