基于深度神经网络的语音识别研究

来源 :沈阳工业大学 | 被引量 : 0次 | 上传用户:zbl666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音作为人与人之间最便捷的交流方式,关于其识别的研究一直是比较热门的话题,尤其是在深度学习流行起来之后,借助神经网络进行语音识别已经成为学术界和工业界的标配,也正是在深度学习的推动下,语音识别在智能家居、输入法、翻译机、语音控制等领域展现了强大的实用性。因此,能够设计出一套语音识别系统变得非常有必要。本文围绕深度神经网络对语音识别系统展开了相关研究。在声学模型部分,使用kaldi作为训练工具,提取40维的MFCC特征,用于基线模型训练。其中首先训练了单音素模型,然后通过决策树状态绑定,训练出三音素模型。通过识别结果验证了三音素结构要优于单音素结构,提升效果约14%;为了减少不同说话人对识别结果的影响,后续又对特征进行处理,如线性判别分析、说话人自适应等操作,最终的识别效果提升约8.4%;在基线模型的基础上,根据状态对齐信息,训练出深度神经网络,来为隐马尔科夫模型提供后验概率。识别结果验证了基于DNN-HMM的声学建模方法要优于传统的GMMHMM方法。最后,通过两个数据量不同的训练集对同一个网络模型进行训练,训练集大的识别结果要比训练集小的识别结果高出1.1%。在语言模型部分,首先使用SRILM语言模型训练工具分析了统计语言模型n-gram得分的计算过程,然后训练出了两个分支模型,并通过插值得到一个语言模型,最后通过识别结果分析分支模型和一个通用模型的优劣。通过对比发现,对于偏向于某一分支的语言模型的测试集来说,不插值的效果要好于插值效果。
其他文献
为建立葡萄根瘤蚜实时荧光定量PCR的检测方法,参考Karen Herbert等设计的特异性引物与TaqMan-MGB荧光探针,构建以标准阳性质粒作为标准品制作标准曲线,并经优化反应条件,建立
过敏性紫癜是以皮肤紫癜、肾损害、关节炎和胃肠病为主要表现,其中以肾损害最为严重,与素体禀赋不足(即过敏性体质)、气阴不足有关,小儿稚阴稚阳肢体,气血未充,易感受外邪。根
期刊
针对电站等电力场所多点谐波动态检测的难点,提出基于多输入、多输出系统测试方法,对输入、输出频响进行复指数拟合,得到全频段的间谐波参数。该方法在研制的并行测试系统中应用,实现了主、从结构测试与分析系统,主站引擎软件作为主控平台协同控制各从站,实现从站的内部多通道同步、从站之间的脉冲同步和远程GPS同步。测试表明该方法能够在全频带范围一次计算出所有间谐波参数,动态范围高于109 dB,通道间相移小于0
农业是最古老的产业,俗语有云:民以食为天!老百姓把粮食放在与天同等的地位,这足以证明粮食在百姓心中的有多么的重要了,也足以证明农业这一古老的产业的重要性!由于我国自古以来就
主要特点:1装配国产名优莱动KM385发动机,低震动、低噪音、低油耗。2.采用HST静液压驱动。无极变速便与喷药量匹配合理速。3.液控手柄操纵力小,换挡更加舒适,可直接前后无级切换。4
目的:探讨ICU中耐药菌肺炎患者的中医体质与初始证候类型的关系。方法:收集耐药菌肺炎病例67例,对患者进行体质调查,并记录患者入院的初始证候类型。结果:气虚质26例,阴虚质1
2014年9月25日,在五莲县许孟镇的一片玉米地里,沉甸甸的玉米正随风轻舞,像是在展示自己的成果,又像是在等待人们的收获。一场由农民自己组织的“五征”玉米收获机演示会正在展开
针对某钢厂铝镇静药芯焊丝钢拉拔频繁断丝问题,分析了断口形貌与成分,并结合生产工艺提出了断丝机理与控制措施。断口电镜分析发现:断口形貌发生扭曲分层,能谱分析表明导致分
卧位型心绞痛浅析中国医学科学院心血管病研究所教授陈纪林卧位型心绞痛是指患者处于平卧位时发生的心绞痛,发生时需立即坐起或站立方可缓解。这种心绞痛多发生在平卧后的1~3h内,所