基于HMM和DNN混合模型研究的语音识别技术

来源 :河北科技大学 | 被引量 : 7次 | 上传用户:acmilanno1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据和人工智能的快速发展,语音识别的相关应用变得越来越普及,如今很多电子产品都通过语音交互进行操作,这让人们更加方便地享受到了现代化智能服务。如何更加高效的实现语音交互,减少噪声对系统识别性能的影响,提高系统的识别准确性是研究的重点所在。本文首先研究了语音信号的预处理和特征参数提取过程,针对梅尔频率倒谱系数(MFCC)只能反映声音信号的静态特性,而经验模态分解(EMD)能够更细致地刻画信号的非平稳特性,本文将EMD融入到MFCC特征提取中。实验结果表明,改进的特征参数提取方法有效地提高了系统的识别效果,在不同的信噪比下识别率最大提高了3.15%。在传统的声学建模中,高斯混合模型(GMM)和隐马尔科夫(HMM)混合模型一直占主导地位,本文在MATLAB上建立小词汇量识别系统进行实验,对比分析可得GMM-HMM相对于单一的HMM来说,对训练数据量的要求不高且具有更好的识别性能。针对GMM对复杂数据的建模能力不足的问题,在此混合模型的基础上采用具有更强建模能力的深度神经网络(DNN)来代替GMM得到新的模型结构,在Linux系统上创建kaldi语音识别工具箱,基于THCHS-30语音数据库实现了大词汇量的连续语音识别系统,实验结果表明DNN-HMM模型比GMM-HMM模型在识别错误率明显下降,且Fbank特征比MFCC更适合深度神经网络模型的训练。在添加噪声环境下,降噪自编码器(DAE)对深层模型进行预训练能够恢复被噪声破坏的信号,有效提升识别的准确性。
其他文献
针对目前可拆卸性设计理论演算太多,设计过程难以实用化的问题,从工程应用角度对该设计方法展开研究.提出了面向对象的层次网络图拆卸模型;基于该模型,对拆卸顺序规划、拆卸
一、农业信息化的内涵及特点农业信息化是一个内涵深刻、外延广泛的概念.作为一种社会经济形态,是农业经济发展到某一特定过程的概念描述.关于农业信息化的理解,我国现在还没
随着教育改革的不断深入,各学校实验教学的质量越发受到社会各界关注,初中阶段是学生接触化学的第一站,因此尤其受到重视,这也使初中化学实验教育背负了更大的期望。实验教学
一、农业改革和发展的提出早在一九九零年三月三日,邓小平同志在同几位中央负责同志谈话中就国际形势和经济问题提出:"中国社会主义农业的改革和发展,从长远的观点看,要有两
野骆驼是世界上唯一存在的骆驼科真驼属野生种,属世界极度濒危物种,历史上广泛分布在中亚干旱荒漠区,数量曾达到10,000峰以上,但到上世纪末,由于人类活动加剧,野骆驼数量和分
摘要 目的:探讨应用Achillon微创系统修复跟腱断裂的适应症、手术方法并观察临床治疗效果。方法:2009年1月—2009年12月,我院应用Achilluon修复9例,并长期随访,观察愈合时间和临床治疗效果。结果:9例患者手术时间短,出血少,恢复快,术后均获得愈合,没有复发断裂,无软组织的感染。结论:Achilln微创系统可用于急性跟腱断裂的修复。  关键词 跟腱断裂 微创 Achillon系统
<正> 五、双因素方差分析实际问题中,有时不只一个因素而是多个因素影响试验的结果。常用到的双因素试验是对两个变异因素各个水平进行交错的全面试验。双因素试验中除每个因
基于理论抽样,本文运用扎根理论方法对裂变型新创企业的生成过程进行了探索性研究,在识别这一过程的基础上,发现企业区位选择即选址问题对于每个裂变型新创企业来说都是关键
目的:探讨类风湿关节炎的中医病因、治疗方法及疗效.方法:选取我院2009年12月至2010年6月收治的60例类风湿关节炎的患者为研究对象,从中医学角度分析其病因,并按照治疗方法的不
“之前婴儿尿布的税率从7.5%下降为2%,我们这里的花王尿布90片的售价很快从168元下降至150元,促销时只卖140元。”上海外高桥进口商品直销中心国际采购部副总经理马骏1月3日告诉科