基于覆盖型神经网络集成的语音识别研究

来源 :南京工业大学 | 被引量 : 0次 | 上传用户:qwert730202
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语言是人类交流最重要的工具之一。随着电子计算机的不断应用与发展以及人工智能的不断进步与完善,人们越来越希望让机器能够理解人类的自然语言,这种需求使得语音识别技术有着十分广阔的发展前景。语音识别正逐步成为信息技术中人机接口的关键技术,它使人们能够甩掉键盘,通过语音命令进行操作。然而语音识别在实现过程中通常涉及多种因素,需要同时考虑,并且它作为一门交叉学科,涉及到了信号处理、模式识别、人工智能、计算机科学、语言学和认知科学等众多学科,所以语音识别距离理想目标仍有很大距离,相关的技术难关还有待克服。 文中对语音识别的主要过程进行了详细的介绍。语音识别首先对输入的语音信号必须进行预处理,以保证系统获得一个比较理想的处理对象。在语音的特征参数提取阶段,文中介绍了在实际应用中常用到的特征参数:线性预测倒谱参数(LPCC)、Mel频率倒谱参数(MFCC)等。在识别阶段,介绍了基于矢量量化的识别技术、动态时间归整的识别技术(DTW)、隐马尔可夫模型技术(HMM)等常用技术,其中重点介绍了神经网络技术。 神经网络是一种模拟生物神经系统的信息处理模型,在联想记忆、非线性映射、分类与识别、优化计算、知识处理等方面都有着广泛的应用,在语音识别这种大规模的模式识别问题也上表现出了一定的潜力。但是,单个神经网络的泛化能力在解决这种大规模的模式识别问题时还不够理想。 神经网络球领域模型,是一种将神经网络的训练转化为n+1维超球面上的点集覆盖问题的神经网络模型,有明显的几何意义。神经网络集成通过训练多个神经网络并将各网络的结论进行合成,从而得到最终结果。集成可以显著的提高学习系统的泛化能力。本文利用球领域模型的几何意义分析了该模型的误差产生原因,提出了基于覆盖思想而设计的神经网络集成方法,在集成过程中利用球领域模型的几何意义给出减少集成系统的泛化误差的算法,从而使系统的识别效果有了进一步的提高。 文中最后对汉语语音识别进行了实验,将单个基于覆盖的神经网络识别、Bagging神经网络集成以及基于覆盖的神经网络集成的识别算法应用于实验中。实验结果表明采用基于覆盖的神经网络集成识别效果要好于另外两种网络。
其他文献
保险公司经过十多年的计算机信息系统的建设已经具备了较完善的业务及其支撑系统,并积累了海量业务数据。但是,这些数据分散在多个独立系统中,信息分散、不共享,数据的完整性、一
汉语自动分词是中文信息处理领域的基础课题,而且也是进行其它中文信息处理的前提,它有三个主要难点分别是分词规范,歧义字段切分和未登录词,国内外许多研究人员在这一领域都
IEEE 802.16无线城域作为未来无线接入技术的重要发展方向,备受各界广泛关注。然而,安全问题一直制约着其进一步的推广与发展。本论文在前人研究的基础上,探讨了IEEE 802.16无线
虚拟化环境是指将多个客户操作系统运行在一台传统的物理服务器的计算环境。虚拟化环境中的每一个客户操作系统称为一个虚拟主机。虚拟机技术屏蔽了客户操作系统和底层硬件之
近年来,随着便携式计算机、个人数字助理等移动终端设备的广泛使用,无线通信和个人通信系统的不断发展,针对移动自组网的研究成为热点课题之一。移动自组网是一种没有基础结构支
随着因特网的不断普及,流数据处理逐渐受到人们的关注。相对于传统的静态数据,流数据具有高度的流动性,对实时更新的要求较高。本文面向网络信息内容分析这一背景,针对流数据
随着Internet的不断发展,网络资源共享的加强,网络安全问题已日益突出,而身份认证和权限管理又是网络应用安全的两个重要内容,它们已逐渐成为了当前信息安全领域中的研究热点
电子支付是指通过网络进行货币支付,其本质是试图把传统的支付方式转化为以网络为介质的电子形式。电子支付是电子商务活动中最为核心和关键的环节,也是电子商务得以进行的基础
本文研究容错协同编辑通信层最主要的目的在于透明地进行容错故障的恢复,尽可能地减少由于回滚产生的计算量,为实时协同编辑系统提供一个可靠的通信层。本文引入故障检测器,建立
随着IT时代的到来,信息化系统已成为各企业管理中心的重要组成部分。为对所有信息化系统设备进行计算机自动化集中管理,作为支撑现代工业生产和社会生活的基础设施的监控组态软