论文部分内容阅读
语言是人类交流最重要的工具之一。随着电子计算机的不断应用与发展以及人工智能的不断进步与完善,人们越来越希望让机器能够理解人类的自然语言,这种需求使得语音识别技术有着十分广阔的发展前景。语音识别正逐步成为信息技术中人机接口的关键技术,它使人们能够甩掉键盘,通过语音命令进行操作。然而语音识别在实现过程中通常涉及多种因素,需要同时考虑,并且它作为一门交叉学科,涉及到了信号处理、模式识别、人工智能、计算机科学、语言学和认知科学等众多学科,所以语音识别距离理想目标仍有很大距离,相关的技术难关还有待克服。 文中对语音识别的主要过程进行了详细的介绍。语音识别首先对输入的语音信号必须进行预处理,以保证系统获得一个比较理想的处理对象。在语音的特征参数提取阶段,文中介绍了在实际应用中常用到的特征参数:线性预测倒谱参数(LPCC)、Mel频率倒谱参数(MFCC)等。在识别阶段,介绍了基于矢量量化的识别技术、动态时间归整的识别技术(DTW)、隐马尔可夫模型技术(HMM)等常用技术,其中重点介绍了神经网络技术。 神经网络是一种模拟生物神经系统的信息处理模型,在联想记忆、非线性映射、分类与识别、优化计算、知识处理等方面都有着广泛的应用,在语音识别这种大规模的模式识别问题也上表现出了一定的潜力。但是,单个神经网络的泛化能力在解决这种大规模的模式识别问题时还不够理想。 神经网络球领域模型,是一种将神经网络的训练转化为n+1维超球面上的点集覆盖问题的神经网络模型,有明显的几何意义。神经网络集成通过训练多个神经网络并将各网络的结论进行合成,从而得到最终结果。集成可以显著的提高学习系统的泛化能力。本文利用球领域模型的几何意义分析了该模型的误差产生原因,提出了基于覆盖思想而设计的神经网络集成方法,在集成过程中利用球领域模型的几何意义给出减少集成系统的泛化误差的算法,从而使系统的识别效果有了进一步的提高。 文中最后对汉语语音识别进行了实验,将单个基于覆盖的神经网络识别、Bagging神经网络集成以及基于覆盖的神经网络集成的识别算法应用于实验中。实验结果表明采用基于覆盖的神经网络集成识别效果要好于另外两种网络。