基于神经网络的语音识别算法研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:dfjixie2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
神经网络或称人工神经网络,是一种智能的非线性处理系统,它和传统模式识别算法的主要不同在于它的信息处理阶段模仿了人脑神经系统的信息处理过程,通过简单的分布式并行来加强自身对信息智能处理的适应性。在处理过程当中它具有存储、联想和检索等多种自识别和抽象的功能,尤其对语音识别等感知性较强的问题具有极强的处理能力。新的神经网络识别系统更具优势和科学性,可以类似人的大脑那样发散性的存储语音信息。本文主要研究基于神经网络的语音识别系统。首先介绍了语音识别和神经网络的原理,构建了简单的基于BP神经网络的语音识别模型,针对该模型的性能,识别效果,做了大量的实验。在详细分析了语音信号的预处理过程,总结了传统特征参数提取法的不足的基础上,提出了本文的优化方法—混合MFCC提取法;针对传统BP神经网络算法不足之处,提出了增加动量因子和使用自适应的学习速率相结合的优化方式。论文主要工作及贡献总结如下:(1)针对IMFCC,Mid MFCC,MFCC三种特征参数在不同的语音频段,识别效果不同,本文提出了一种优化方法—混合MFCC提取法,所采用将三者结合起来的混合算法,使用滤波器组来构造特征参数。使用本算法提取的特征参数相比传统的LPCC参数,传统的MFCC参数,LPCC与MFCC混合参数等传统参数具有更好的识别性能,有效地提升了语音各个语音频段中的识别精度。(2)针对传统BP神经网络算法容易出现局部最小,收敛速度不够快等不足之处,本文采用了同时增加动量因子和使用自适应的学习速率的方法来优化BP算法。实验表明,改进后的算法相比传统的BP算法,能有效的防止BP网络陷入局部最小和改善神经网络的收敛速度慢的缺点。论文采用优化了的混合MFCC参数提取方法,改进了BP神经网络算法在语音识别中的应用,并采用0-9十个孤立数字作为实验对象,利用实验和仿真对改进的算法进行了验证。在此基础上,完成了一套完整的语音识别系统构建,为语音识别的改进和优化提供了新的思路。
其他文献
目的通过探讨创伤性膈疝的手术前诊断和治疗经过,对创伤性膈疝有充分认识,减少对其的误诊和漏诊。方法回顾分析了本院14例创伤性膈疝的诊断和治疗经过。结果14例患者经均胸片、
目的观察腹腔镜下微创手术治疗早期宫颈癌的临床效果。方法对本院67例诊断为早期宫颈癌的患者,分为腹腔镜组与开腹组,其中腹腔镜组手术操作均在腹腔镜下进行,开腹组采用常规手术
结合北京石化球罐施工工程实例,分析了施工管理难点,深入探讨了工程管理措施对三台球罐的施工进度、质量等进行了研究,得出了施工质量全部合格的结论,具有一定的参考价值。
介绍了石村沟特大桥工程概况,采用QJX软件对该桥进行了施工阶段的计算,详细阐述了石村沟特大桥主桥的线形控制过程,并通过对施工现状的测量分析,制定了相应的对策,从而达到了预定
《中国地震简Ⅱ》与1983年版《中国地震目录》相比,有47次≥7级地震是重新修订和新增添的,本文对这些地震分为更正发震日期、重新确定震中位置、调整震级、新发掘的7级以上地震及部分8级地震的变化情况等进行了概要介绍.
目的探讨全凭静脉麻醉在颅内动脉瘤微创栓塞术中应用的可行性。方法选择107例ASAI-Ⅱ级在全麻下行颅内动脉瘤微创血管内栓塞术患者,根据全麻药物维持不同分为两组:A组(静脉输注
目的观察非超乳小切口撕囊技术治疗白内障的效果。方法回顾性分析105例采用非超乳小切口撕囊技术治疗白内障患者的临床资料。结果105例中85例非超乳小切口撕囊技术完成,20例因
9月17日,在黑龙江垦区鹤山农场现代化农机管理服务中心,来自九三管理局各农场农机、畜牧等相关负责人参加了约翰迪尔公司举办的约翰迪尔7380型青贮收获机现场演示会。
通过对某六层砖混结构住宅楼墙体及顶板裂缝检测结果的分析,阐述了裂缝形成的主要原因,并对防止砖混结构开裂的住宅设计提出了几点建议,以保证砖混结构工程的使用质量。
目的 评价子宫B-lynch术在治疗剖宫产术中出血中的应用价值. 方法 回顾2009年3月至2012年12月,在本院剖宫产术中,因出血多而行子宫捆扎和宫腔纱条填塞的病例,分析治疗结果.