【摘 要】
:
随着深度学习的发展,研究方向从最开始的图片领域扩展到语音识别、声纹识别和自然语音处理等方面。其中声纹识别被当作识别人身份的一种生物认证技术也逐渐得到了关注,该技术
论文部分内容阅读
随着深度学习的发展,研究方向从最开始的图片领域扩展到语音识别、声纹识别和自然语音处理等方面。其中声纹识别被当作识别人身份的一种生物认证技术也逐渐得到了关注,该技术是通过在不受干扰的前提下对说话人的语音信号进行提取与处理,从而获得能表征说话人的个性信息。深度学习的出现,解决了传统模型中因局部最优带来的过拟合问题,且可以更好的对说话人的特征进行学习。为了使深度学习在声纹识别中得到更好的应用,本文从以下几个方面进行研究。第一:介绍了声纹识别研究背景与历史发展,分析了传统声纹识别方法的缺点并引出了深度学习作为声纹识别的研究方向。第二:对语音信号的前端处理进行研究,其中包含了对语音信号预处理和语音信号增强技术的研究。本文在基本谱减法的基础上提出了自适应多窗谱减法,该算法根据输入语音信号的信噪比自适应调整参数,解决了基本谱减法中因参数固定而导致的重要信息缺失问题,增强了语音信号降噪效果。第三:对基于长短时记忆网络(LSTM)的声纹识别方法进行研究,构建LSTM网络模型,并在已有的LSTM网络模型的基础上,采用滑动窗口对输入序列进行切分,保持了语音信号的连续性;在声纹识别的判决中,引入片段相似性损失函数,可以对说话人的局部信息进行深入挖掘。第四:对基于语谱图的卷积神经网络(CNN)声纹识别方法进行研究。将语音信号的语谱图输入到不同的卷积神经网络,并将残差网络Res Net-50的完全连接层和平均池化层进行优化。第五:采用麦克风对声音进行采集,构建一个包含60人(男38人,女22人)的声纹数据库,分别应用在长短时记忆网络和卷积神经网络中,对比该数据集与标准的TIMIT数据库在声纹识别系统下的性能。本文在应用语音增强算法的前端处理基础上,研究了深度学习在声纹识别上的应用,利用已有的网络模型中,对网络进行改进,使得声纹识别系统的识别率达到93.5%。
其他文献
黄宗宪,字玉屏,号小谷(又作筱谷),湖北省新化县人,约生于十九纪四十年代,卒于二十世纪初,是清代末期著名数学家。黄宗宪与曾纪鸿及左潜等人同为丁取忠的弟子,他们常常一同探讨数学。作为最早赴欧洲的数学家之一,黄宗宪还将西方知识与中国传统数学相结合,将数学的实用性及其理论相结合。这些在其数学著作《求一术通解》、《容圆七术》、《曲面容方》和《练炮宜知》中得到了充分的体现,故本文对这四部数学著作展开研究。《
改革开放以来,依据我国的要素禀赋结构,我国外贸走上了比较优势战略之路,取得了巨大的经济成就,但也暴露诸多问题,显现陷入“比较优势陷阱”的迹象,我国外贸发展战略必须进行转型升
目的研究中医内科治疗消化内科疾病的效果。方法随机选择本院于2015年12月至2016年5月期间收治的消化内科疾病患者50例,并作为研究对象,分为两组,研究组实施中医内科治疗,对
1972年,加拿大国家研究所的T.R.Pryer提出了激光衍射测量方法。一种利用激光作为光源照射待测物,通过衍射图样的变化,对待测物的各项物理性质进行精密测量的一种测量方法。这
对我国人口较少民族聚居区儿童体质健康状况进行分析,直观分析鄂伦春等10个民族儿童死亡状况,研究认为除鄂鄂伦春族和鄂温克族外,其他民族儿童体质健康状况不容乐观,生产水平
在当代绘画艺术中,重复的形式频频出现,越来越引发人们的关注与思考。本文将从抽象表现主义之后在绘画中的重复形式进行梳理分析。20世纪下半叶,美国最重要的艺术批评家克莱
小朋友们,你们知道吗?文具之间也存在竞争呢!每一种文具都会向别人展示自己的长处,觉得自己才是最棒的!不信呀,请读读《竞争中的文具》。读完后,笑不笑由你,嘿嘿嘿(我好像听见有人开始笑了)! 主持人:开心果 呀!这是哪传来的争吵声啊!吵死人了。原来,今天文具公司的老板要裁员。 广播响了,里面传来铅笔小姐细嫩的声音:“今天老板要开会,请大家到会议室开会。”正在工作的涂改液、胶条、改正纸和修改符号听
纪录片作为影视艺术的一种表现形式,自诞生以来就发挥着重要的作用。在多元化的今天,纪录片真正打动人们的心灵的,将是越来越成熟的情感表达。事实上,观众在观看时不仅需要记录事实的完整性和清晰性,更需要深层次的精神满足。本文以毕业作品《少年足球梦》为例,记录了乌鲁木齐第五小学足球队队员的学习训练日常与生活。乌鲁木齐第五小学作为新疆赛区最强的队伍,多次斩获全国性青少年足球比赛金牌,在历经多次的比赛活动中遇到
通过对电动平板车传动轴断裂机理分析,改进轴结构设计,外加两只副轴承座,改外伸梁结构为静不定系统,从而在不改变轴直径的情况下大幅度提高轴的承载能力。