低复杂度深层神经网络声学建模研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户：syf1122

【摘要】

：

在过去的40多年间，语音识别在隐马尔科夫模型(HMM)和高斯混合模型(GMM)的框架下得到了很大的发展，在多种应用环境中都取得了较好的性能表现。近年来，随着硬件水平的提升和学习算

【作者】

：

邢安昊

【机构】

：

中国科学院大学

【出处】

：

中国科学院大学

【发表日期】

：

2016年期

【关键词】

：

自动语音识别声学模型深层神经网络低复杂度

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在过去的40多年间，语音识别在隐马尔科夫模型(HMM)和高斯混合模型(GMM)的框架下得到了很大的发展，在多种应用环境中都取得了较好的性能表现。近年来，随着硬件水平的提升和学习算法的进步，基于神经网络，特别是深层神经网络(DNN)的声学建模技术再次引起了语音识别领域的关注，相比GMM，DNN体现出了更强的建模能力，但同时也具有更大的参数规模。随着智能手机的流行，智能家居概念的兴起，在嵌入式平台上搭载先进的语音识别系统的需求也越来越多。嵌入式系统的计算和存储能力往往弱于普通电脑和服务器，DNN的大规模参数量和高计算复杂度阻碍了深度学习技术在嵌入式设备上的应用。本文针对低复杂度DNN声学建模，进行以下几方面的工作:　　1.对目前国内外研究团体在低复杂度DNN建模方面的研究进展进行了调研，并且分析了各种技术的优缺点。　　2.利用DNN模型权值矩阵的稀疏性对权值矩阵进行裁剪，并进一步提出可以将目标函数对权值的二阶微分作为权值重要性的评判依据，并据此对权值矩阵进行裁剪。DNN的权值矩阵具有很强的稀疏性，大多数的权值幅度非常的小，可以以权值幅度为标准，对DNN模型的权值进行大规模的裁剪。为了提高裁剪的精度，本工作还进一步利用对角化的Hessian矩阵来计算权值的重要性，并以此为标准对DNN权值进行裁剪。　　3.引入主成分分析的方法对DNN权值矩阵存在的冗余进行分析并且消除这部分冗余。在本工作中，DNN的权值矩阵被近似地看作一组向量的集合，我们首先验证了这组向量满足主成分分析所需要的零均值条件，这样就可以利用奇异值分解找出DNN权值矩阵的主成分，通过将次要的主成分裁剪，最终将满秩的权值矩阵转换成了两个低秩矩阵的乘积，从而大大降低了模型规模和计算量。　　4.提出利用多级矢量量化对DNN进行压缩的方法，该方法是对之前提出的矢量量化压缩DNN的方法的改进。对DNN进行矢量量化会造成明显的性能损失，本工作首先通过实验分析了量化误差与错误率之间的关系，为了有效地降低量化误差，本工作并没有呈指数式地增大码本规模，而是引入第二级量化，对矢量量化后的残差向量进行量化，通过这种方式，最终只需要两个非常小的码本，就可以使得DNN性能几乎不下降，并且本工作提出的改进方法依然具有原方法的节省空间和计算量的优点。　　5.提出了一种快速确定DNN超参数对性能影响的方法。在工业界，DNN的超参数（隐层数和节点数）的确定一直都是一个依靠经验和试验的过程。通过实验我们分析了影响DNN性能的几个因素—隐层数，隐层节点数，训练数据量。根据实验探究的结果，本文提出一种迭代式的DNN节点裁剪方案:在训练阶段训练一个较大规模的模型，然后迭代地对其进行节点裁剪，在这个过程中，我们可以在很短的时间内得到各种规模的模型。通过实验，这些模型与直接从头训练的等参数量DNN性能相当，然而获得这些模型所需要的时间却少很多。

其他文献

OFDM中的信道估计与均衡联合接收方案

在未来的B3G/4G的移动通信系统中,OFDM将成为一个关键的物理层技术,它能够有效的对抗多径衰落,并且频谱利用率高。为了更好的对抗信道衰落,在OFDM系统中,信道估计与均衡等接

学位

Turbo均衡盲信道估计线性预编码OFDM互相关

宫外孕方联合西药保守治疗异位妊娠的临床研究

目的探讨单用西药和中西医联合保守治疗异位妊娠的临床效果.方法选取40例2016年1月-2019年2月在温州市中医院妇科就诊治疗的异位妊娠患者,按治疗方法不同将患者随机分为对

期刊

甲氨蝶呤保守治疗异位妊娠宫外孕方

基于深度学习的高分辨率光学遥感图像目标解译方法研究

目标自动解译是高分辨率光学遥感图像应用领域的重要研究内容，在土地资源调查、城市规划、军事侦察等领域有着广泛的应用。能否提取到符合图像规律的特征对目标解译方法的成功

学位

遥感图像目标解译视觉显著性深度学习神经网络形状先验模型

深圳市南山区学龄前儿童冷执行功能及其影响因素调查研究

目的调查深圳市南山区学龄前儿童冷执行功能特征,并探讨其家庭状况方面的影响因素.方法采用分层整群随机抽样的方式在南山区心理筛查的托幼机构中随机抽取6所,对其3～5岁幼儿

期刊

执行功能学龄前儿童托幼机构家庭经济条件

几种草坪草的组织培养及遗传转化体系的建立

草坪草在人类生活中的地位越来越重要,以至已形成一项方兴未艾的产业——草坪业,筛选与培育优良的草坪草品种是草坪业的重要任务。由于传统育种手段的局限性,运用先进的分子

学位

草坪草种子萌发组织培养抗生素中草药农杆菌

氨基酸辅助合成的荧光碳点在转染siRNA影像治疗胃癌的应用基础研究

近年来，荧光碳量子点因其在生物成像，标记，催化学等方面的应用而受到广泛关注。通过巧妙的结构设计，最大限度地简化合成步骤和后处理工序，制备具有较高光、电、热等物化性能、良好

学位

细胞成像氨基酸荧光碳点胃癌基因干扰治疗生物安全性

雷达导引头系统建模仿真与性能评估

雷达导引头是导弹完成对目标的搜索与精确跟踪，并最终实现打击的关键。随着现代空空及地空导弹的快速发展，利用仿真的手段对雷达导引头系统进行建模和仿真，并分析其工作性能，成为

学位

雷达导引头系统建模仿真性能评估层次化模块

早期先兆流产安胎结局的影响因素分析

目的探讨影响早期先兆流产安胎结局的相关因素.方法回顾性分析2016年1月-2018年12月在杭州市大江东医院接受治疗的120例早期先兆流产产妇的临床资料,依据其安胎结局将上述

期刊

先兆流产早期安胎结局影响因素

初中物理实验思想方法的有效转化策略

摘要：转移经验能力是获取并实践思想方法的关键。在初中物理实验教学中，教师们要着力培养学生转移经验能力，侧重培养概括能力、联想能力和分析类化能力。文章从实验思想方法教育及其关键的贯穿其中的转移经验能力培养两方面来探索实验思想方法的有效转化。　　关键词：物理实验；思想方法；转移经验；能力转化　　科学思想方法对学生认知活动有指导、调控的作用。在初中物理实验教学中，要使学生领会实验思想方法。领会了思想方法

期刊

物理实验思想方法转移经验能力转化

联合检测溶血三项和血清中总胆红素水平对由ABO-新生儿溶血病引起高胆红素血症的早期诊断价值

目的探讨联合检测溶血三项和血清中总胆红素水平对由ABO-新生儿溶血病(HDN)引起高胆红素血症的早期诊断价值.方法将2017年2月-2019年2月期间山西大同煤矿集团有限责任公司

期刊

高胆红素血症新生儿溶血病溶血三项早期诊断

低复杂度深层神经网络声学建模研究

与本文相关的学术论文