论文部分内容阅读
神经网络或称人工神经网络,是一种智能的非线性处理系统,它和传统模式识别算法的主要不同在于它的信息处理阶段模仿了人脑神经系统的信息处理过程,通过简单的分布式并行来加强自身对信息智能处理的适应性。在处理过程当中它具有存储、联想和检索等多种自识别和抽象的功能,尤其对语音识别等感知性较强的问题具有极强的处理能力。新的神经网络识别系统更具优势和科学性,可以类似人的大脑那样发散性的存储语音信息。本文主要研究基于神经网络的语音识别系统。首先介绍了语音识别和神经网络的原理,构建了简单的基于BP神经网络的语音识别模型,针对该模型的性能,识别效果,做了大量的实验。在详细分析了语音信号的预处理过程,总结了传统特征参数提取法的不足的基础上,提出了本文的优化方法—混合MFCC提取法;针对传统BP神经网络算法不足之处,提出了增加动量因子和使用自适应的学习速率相结合的优化方式。论文主要工作及贡献总结如下:(1)针对IMFCC,Mid MFCC,MFCC三种特征参数在不同的语音频段,识别效果不同,本文提出了一种优化方法—混合MFCC提取法,所采用将三者结合起来的混合算法,使用滤波器组来构造特征参数。使用本算法提取的特征参数相比传统的LPCC参数,传统的MFCC参数,LPCC与MFCC混合参数等传统参数具有更好的识别性能,有效地提升了语音各个语音频段中的识别精度。(2)针对传统BP神经网络算法容易出现局部最小,收敛速度不够快等不足之处,本文采用了同时增加动量因子和使用自适应的学习速率的方法来优化BP算法。实验表明,改进后的算法相比传统的BP算法,能有效的防止BP网络陷入局部最小和改善神经网络的收敛速度慢的缺点。论文采用优化了的混合MFCC参数提取方法,改进了BP神经网络算法在语音识别中的应用,并采用0-9十个孤立数字作为实验对象,利用实验和仿真对改进的算法进行了验证。在此基础上,完成了一套完整的语音识别系统构建,为语音识别的改进和优化提供了新的思路。