基于深度学习的声纹识别系统研究与实现

来源 :辽宁大学 | 被引量 : 0次 | 上传用户:happy_hoo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的进步、互联网的高速发展,声纹识别这一技术在人与电子产品交互的过程中扮演者越来越重要的角色。当下,许多研究人员把目光投向声纹识别这一研究领域中来。声纹识别技术的发展日趋成熟,拥有坚实的理论体系和很高的社区热度。传统的GMM(高斯混合模型)是声纹识别领域中非常经典且重要的一个模型,但由于其对大语音数据的建模能力和对于噪声的处理不好,研究人员开始研究基于深度学习的声纹识别,引入了卷积神经网络(CNN)进行模型的训练。残差网络作为卷积神经网络中的一种,通过使用残差网络训练模型,可以得到不错的效果。本文基于深度学习技术,研究和设计实现了基于深度学习的声纹识别系统,可实现对特定说话人的有效识别。该系统的构建基于Python等高级语言,以Tensorflow,Keras等深度学习框架为基础。本文所提出的基于深度学习的说话人识别系统中,主要包含两个步骤:声纹注册阶段,数据训练阶段和说话人在线识别阶段。声纹注册阶段对用户语音进行采集,接下来在数据训练阶段,首先使用预加重、分帧、加窗算法对语音文件进行预处理,并进行语谱图的计算;然后,利用改进的残差神经网络对输入的特征数据进行训练以提取特征向量;最后在提取阶段完成后,将特征图输入到NetVLAD层中进行聚类,之后使用AMSoftmax损失函数进行评估,然后保存模型。在声纹识别阶段,本系统将采集到的测试语音进行预处理后,输入到已经训练好的模型进行分类识别。此外,本系统还包含以下核心模块:用户登录注册、声纹注册、模型训练,声纹识别等模块,能够最终实现在B/S架构下有效完成用户远程联网进行声纹识别需求的功能。通过理论分析和测试实验,可以发现,本文所设计声纹识别系统与传统系统相比,本文所提出系统使用网络的网络结构进行模型训练以及模型识别,相较于其他卷积神经网络,有更高的准确率,且该系统使用B/S架构,用户在浏览器端即可进行操作,可以满足用户进行远程声纹识别的需求。
其他文献
隐孢子虫(Cryptosporidium spp.)、毕氏肠微孢子虫(Enterocyotozon bieneusi)以及十二指肠贾第虫(Giardia duodenalis,以下简称贾第虫)是三种常见的人兽共患寄生虫。这三种寄
应用高效液相色谱(HPLC)法对鸵鸟油脂肪酸中多不饱和脂肪酸组成进行了定性定量分析.采用α-溴苯乙酮为衍生化试剂,应用Hypersil BDS C18柱,252nm紫外检测,能很好地分析鸵鸟油
<正>质量管理体系是企业管理者提高战略决策的重要手段,不仅可为企业带来直接利益,而且对成本和风险的管理起着至关重要的作用。近年来,随着各企业普及推行质量管理体系,在质
目的:观察中西医结合治疗维持性血透患者(MHD患者)合并抑郁障碍的临床疗效。方法:80例MHD合并抑郁障碍患者纳入本研究,随机分为对照组及试验组,对照组采用常规心理干预治疗,
本文首先给出冷涡的定义,然后根据此定义识别出2009—2013年4—9月的冷涡有65个,分析冷涡的时空分布特征及生命史特征发现:冷涡的月变化特征明显,7月冷涡个数和维持的天数最
随着当前社会经济的发展和科学技术的进步,电子商务取得了很大的发展成就,目前变成了国民经济的重要组成部分和影响因素。电子商务的发展的社会环境下,客户的信息量都在不断
利用加拿大环境部气候研究中心研发的PMTred非均一性检验方法,以ERA-interim资料作为参考序列,应用中国区域各探空台站详细的元数据信息为主要断点判断依据,对1979—2012年我
<正> 《汉语拼音方案》是根据普通话语音系统制订的一个给汉字注音和拼写普通话语音的方案,它是汉语拼音教学的依据。小学教学汉语拼音,是从儿童的年龄特征和接受能力出发,帮
船舶与船舶/海洋平台和船舶与冰的碰撞是一类常见且后果严重的海洋事故。碰撞事故会破坏海洋结构物和船舶结构的完整性,污染海洋环境,甚至威胁海洋从业人员的生命安全。合理
目的探讨社区卫生服务机构突发公共卫生事件医疗应急能力现状。方法本研究以广州市为例,采用文献研究法和专家咨询法,构建社区卫生服务机构卫生应急能力评估指标体系;采用自