基于深度神经网络的说话人识别算法研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户：jieswh

【摘要】

：

【作者】

：

李浩

【出处】

：

广东工业大学

【发表日期】

：

2019年01期

【关键词】

：

说话人识别高斯混合模型深度学习瓶颈特征

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

说话人识别是一种基于生物特征的身份认证技术,也被称为声纹认证。是根据不同的说话人语音之间的个性信息和特征来区分不同的说话人的身份。由于说话人识别技术具有可扩展性好,所需要的设备简单且成本低廉,用户易接受等优点,可被广泛的应用在了银行系统,刑侦侦查,国防军事等领域。说话人识别伴随着半个多世纪的发展已经取得了不错的发展,已经有大量的产品问世,但是现有的说话人识别系统还存在着对环境噪声比较敏感以及安全性不高等问题需要解决和完善。高斯混合模型凭借着大量的高斯概率密度曲线,实现了对说话人语音特征比较好的分类,在说话人识别领域中取得了不错的识别性能,是说话人领域中的一个经典的识别模型。但是实验发现高斯混合模型对说话人语音的规模很依赖,较高的识别性能往往需要大量的说话人语音经过训练才能实现。并且对环境噪声比较敏感,鲁棒性较差。深度学习是最近几年发展起来的一种模式识别技术,已经在图像分类和识别中取得了很大的突破,并且具有自主学习的能力,能根据目标不断地优化所提取出的特征。因此能够提取出对环境噪声不敏感的深度说话人语音特征。并且凭借着强大的模式分类能力能够将提取到的说话人语音特征参数进行很好的分类识别。为此本文将深度学习技术引入到了说话人识别中的特征参数提取和对特征参数的建模和识别中来,以提高说话人识别系统的性能。主要的工作如下:(1)介绍了说话人识别中语音的基本技术。说话人识别中语音预处理包括语音去噪,端点检测,加窗和分帧。本文主要介绍了两种语音增强技术,并做了实验对比。介绍了端点检测的重要性和本文所采取的端点检测技术。介绍了加窗和分帧的重要性和必要性。对常见的说话人语音特征参数做了介绍,对经典的MFCC特征参数做了详细的推导。介绍了主流的说话人识别模型。(2)研究了基于深度神经网络的瓶颈特征的提取和识别性能的验证。本文将深度学习引入到了说话人语音参数的提取中来,对瓶颈特征的基本原理和提取过程做了一个详细的叙述。并结合高斯混合模型将瓶颈特征用于说话人识别。通过详细的实验验证了瓶颈特征相对于MFCC特征参数的性能提升。(3)针对高斯混合模型鲁棒性不强的缺点,研究了基于瓶颈特征和MFCC特征参数的复合特征在深度神经网络下的性能表现。本文研究了两种不同的说话人特征参数融合方式,并分别和不同的深度神经网络结合。验证了复合特征在深度神经网络做后端分类识别的良好的性能表现,通过实验验证了这种识别方法在抗噪能力和安全性上的巨大的提升。

其他文献

吐丝期干旱胁迫对玉米生理特性和物质生产的影响

以玉米品种郑单958(抗旱性强)和陕单902(抗旱性弱)为材料,采用抗旱池栽控水试验,研究了2个品种叶片光合特性、保护酶活性以及干物质转运对吐丝期干旱胁迫的响应。结果表明,在

期刊

玉米干旱胁迫生理特性干物质积累与转运籽粒产量

针灸疗法治疗儿童周围性面瘫临床疗效的Meta分析

目的:系统评价针灸疗法治疗儿童周围性面瘫的临床疗效。方法:系统检索CNKI、VIP、CBM、Wanfang Data、PubMed和Web of Science数据库,检索时限为建库至2019年2月。检索搜集所

期刊

针刺针灸疗法儿童周围性面瘫meta分析

ERP信息系统对内部控制有效性的影响——基于某集团ERP销售与收款环节内控案例的思考

市场信息瞬息万变,企业决策运营需要以准确及时的数据信息为依据,ERP信息系统作为企业信息系统的一部分,改变了原有企业的业务流程,将先进的管理理念与计算机信息技术相结合,

会议

ERP系统内部控制有效性业务流程

顺应论视角下模糊语在商务英语说服信函中的对比研究

随着全球贸易的飞速发展,全球经济的不断进步,商务英语信函在国际交流中的地位日益凸显。在商务英语信函写作中,人们一贯秉承严谨,简洁,礼貌,避免模糊的写作原则。然而在实际

学位

说服信函模糊语言英语本族语者中国英语学习者对比研究

高职院校教师职称评审体系指标量化初探

当前高职院校职称评审体系存在诸多问题：评审标准硬套,考核体系不全面,评审主体单一,导向作用不突出等.对此,应当在坚持科学设置指标,加强日常考核,评价主体多元等原则的基础

期刊

高职院校职称评审指标量化

PSF和p54nrb蛋白对PRRSV在MARC-145细胞中增殖的影响

猪繁殖与呼吸综合征病毒(Porcine reproductive and respiratory syndrome virus,PRRSV)是一种影响广泛并且危害严重的猪病病毒,对我国养猪业的正常生产造成了严重的经济损失。因此,对于猪群中的PRRSV的感染情况的了解、发展趋势及防控形势等信息的掌握显得尤为重要。本研究将2015-2017年山东省各地区收集的3526份疑似样品使用PCR方法进行PRR

学位

PRRSV感染情况PSFp54nrb病毒增殖

金融危机中的货币战争——简析此轮国际金融危机中美国政府救市政策的实质及其对中国的影响

从当初发生在美国房贷市场上的次贷危机,到深入影响各大银行运作的信用危机,再到波及整个美国甚至全球金融系统的金融海啸,最后演变为震荡全球经济的经济危机,一步步愈演愈烈

期刊

金融危机货币政策救市影响

从贺敬之的诗集看歌剧《白毛女》的“原创性”

贺敬之等同志集体创作的歌剧《白毛女》，经过66年的历史检验，已被公认为表现中国人民在共产党领导下进行革命斗争翻身解放的红色经典、五四以来中国歌剧最优秀的艺术精品、为中

期刊

延安文艺座谈会歌剧《白毛女》杨白劳《白毛女》黄世仁一以贯之何其芳

旅游公共服务质量量表的设计与检验

随着外出旅游这一行为在国内的普及,游客的旅游偏好、出游方式以及对旅游产品的需求等发生了深刻的变化,游客对旅游公共服务质量的要求也日趋强烈。然而很多地区的旅游公共服

期刊

旅游公共服务质量量表开发游客行为意向扎根理论

基于ISSR标记的小黑麦遗传多样性分析及在甘肃省临洮地区的生产性能研究

小黑麦不仅继承了小麦高产优质和黑麦抗病、抗寒、抗旱及适应性强的优点,而且还具有杂种优势强、光合效率高、营养品质好等特征,可作为粮食、饲料、酿酒、保健食品等材料。本

学位

小黑麦ISSR标记遗传多样性种子产量草产量营养价值

基于深度神经网络的说话人识别算法研究

其他学术论文