基于DNN的低资源语音识别特征提取技术

来源 :自动化学报 | 被引量 : 0次 | 上传用户:softwareuse
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对低资源训练数据条件下深层神经网络(Deep neural network,DNN)特征声学建模性能急剧下降的问题,提出两种适合于低资源语音识别的深层神经网络特征提取方法.首先基于隐含层共享训练的网络结构,借助资源较为丰富的语料实现对深层瓶颈神经网络的辅助训练,针对BN层位于共享层的特点,引入Dropout,Maxout,Rectified linear units等技术改善多流训练样本分布不规律导致的过拟合问题,同时缩小网络参数规模、降低训练耗时;其次为了改善深层神经网络特征提取方法,提出一种基于凸非负矩阵分解(Convex-non-negative matrix factorization,CNMF)算法的低维高层特征提取技术,通过对网络的权值矩阵分解得到基矩阵作为特征层的权值矩阵,然后从该层提取一种新的低维特征.基于Vystadial 2013的1小时低资源捷克语训练语料的实验表明,在26.7小时的英语语料辅助训练下,当使用Dropout和Rectified linear units时,识别率相对基线系统提升7.0%;当使用Dropout和Maxout时,识别率相对基线系统提升了12.6%,且网络参数数量相对其他系统降低了62.7%,训练时间降低了25%.而基于矩阵分解的低维特征在单语言训练和辅助训练的两种情况下都取得了优于瓶颈特征(Bottleneck features,BNF)的识别率,且在辅助训练的情况下优于深层神经网络隐马尔科夫识别系统,提升幅度从0.8%~3.4%不等.
其他文献
CET-6 is a nationwide and standardized test to evaluate college students’ English levels. Now more than 10 million college students take part in the exam every
期刊
建立测定蛹虫草发酵液中虫草素含量的高效液相色谱法,对比8株不同产地的蛹虫草液体深层培养液中虫草素的含量。使用XTerra RP18色谱柱,以甲醇与磷酸盐缓冲液(pH值6.8)体积比
该文通过问卷和访谈的形式,对理工科部分大学生的英语快速阅读现状进行了统计和分析,发现理工科大学生的英语快速阅读知识欠缺和能力偏低,并依此提出一些能帮助学生提高英语
2月18日时,国家电网黑龙江省电力公司灾区电网恢复重建支援队首批200人抵达湖南长沙,并连夜奔赴受灾现场,完成了在湖南前线的灾后重建排兵布阵工作。
<正> 皮炎灵溶液(以地塞米松、醋酸铝溶液和薄荷脑为主要成分的复合制剂)是本院根据本地区常见病例分析,收集临床用药反馈信息而研制的皮肤科外用搽剂。自投放临床应用以来,
“三农”问题是我国社会主义现代化建设面临的重大历史问题。党中央、国务院高度重视并支持农电事业发展。新中国成立以来,我国农村电力事业从无到有,快速发展。特别是1998年以
目的:观察黄芪口服液对晚期恶性肿瘤的疗效,以及与化疗药联用在减毒增效、降低复发转移等方面的作用。方法:黄芪口服液餐前口服,每次20ml,每日3次。疗程至少30天。结果:对不宜手术和放、化
目的:探讨各种疾病状态下肺弥散功能的变化。方法:用单次呼吸法将90例分3组测定肺弥散功能。第一组30例为肺总量高于正常预计值的健康体检者,第二组30例为肺气肿患者,第三组30例为弥漫性间
本刊去年曾出版“青年学术论文选专号”受到广大读者欢迎。为了继续扶持社会科学界的新生力量,为青年作者的优秀科研成果提供发表园地,我们准备今年再出版一期“青年学术论文选专号”。为此,特公开征文:
数学家庭作业是小学生巩固数学课堂学习成果的重要媒介,家庭作业的质量直接影响着学生复习巩固数学课堂学习成果的效率,农村小学数学教师应慎重斟酌数学作业的内容和形式,帮