基于RBF神经网络的语音识别方法的应用研究

来源 :大连海事大学 | 被引量 : 19次 | 上传用户:hekaishou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机、通讯技术的不断发展,人们越来越迫切希望可以在任何时候、任何地点、与任何机器都可以自然交流,而语音通信则是一种最理想的人机通信方式,语音识别技术由此诞生。人工神经网络在语音识别方面所表现出来的优势,使之成为研究的热点。在诸多神经网络模型中,径向基函数神经网络是一种新颖有效的前馈式神经网络模型。它的网络拓扑结构是在学习过程中动态确定,使网络的适用性更好,激活函数采用高斯函数,此函数具有很好的局部逼近能力,就其训练算法而言,其学习速度快,不存在局部最优问题。因此本文采用径向基函数神经网络用于语音识别。本文首先分析了语音识别技术的发展现状,就当前语音识别所存在的问题确定了本文的研究方向;然后系统地介绍了语音识别的基本原理和技术,为语音识别仿真提供了理论支持;最后,详尽地介绍了径向基函数的网络模型、常规聚类训练算法以及用于语音识别的建模方法。考虑到K均值聚类算法在确定其中心节点时速度较慢,本文基于迭代自组织的数据分析算法提出了改进的算法。为了证明所提出的改进算法优于K均值算法,本文基于家用电器的指令平台,针对非特定人孤立词识别任务,将径向基函数神经网络模型应用到语音识别领域,采用VC++和Matlab混合编程的技术,在PC机上分别研究构造了两种算法相应的语音识别模型,并给出了仿真结果与实验分析。实验结果表明,在相同的情况下,与传统的RBF算法相比,本系统在识别速度上有一定的提高,充分说明了改进的RBF算法使网络的性能及分类能力得到了充分的发挥,为基于神经网络的语音识别方法的研究提供了理论分析与仿真数据。同时分析讨论了训练样本数目、背景噪声对识别结果的影响。
其他文献
当代的计算机应用程序大部分是多媒体应用,包括音视频处理,图像处理,3D绘图,语音识别等,这就对处理器提出了更加严格的实时性要求。因此,多媒体SIMD扩展结构,已经逐渐为通用
伴随着信息技术的飞速发展,计算机已经成为人们最重要的生产、生活工具。块存储设备作为计算机的主要数据存储设备,携带着大量的机密信息和重要数据。由于丢失、被盗或者未经
随着Internet技术和企业信息化建设的发展,电子商务以其迅猛的速度进入人们的日常生活。电子商务的发展对传统的Web技术提出了强有力的挑战。由于电子商务的内部逻辑复杂,安全
句法分析是自然语言处理的关键技术,依存关系解析是句法分析的方法之一,这种方法解析句子词语间的依存关系,依存关系可以明确地表明词语间的支配关系,并能方便地转化为语义依
解决问题的方法也叫做算法,并不是计算机科学的专有名词,早在几千年前就有该方面的研究,当时把其认为是数学的一个分支。计算机的出现使得人们能够利用计算机模拟并解决实际问题
随着Internet技术的迅速发展,网络入侵问题也越发严重,入侵检测己成为网络防护安全体系中的重要组成部分。入侵检测系统通过从计算机网络或计算机系统中的若干关键点收集信息
目前,由于我国支票使用总量的年年增加,给银行业务带来很大的工作量和压力。影像化支票自动识别作为解决此问题的一种计算机应用技术,已经越来越多的受到人们的重视和研究。而在
随着互联网的发展,网上信息迅速增加,搜索引擎作为帮助人们从网络中快速获取信息的工具,使用日益广泛。但由于存在许多网页转载的情况,搜索引擎的返回结果中存在重复信息,既
我国证券市场已走过了十几年的历程,虽然起步较晚,但在证券信息计算机处理方面起点很高、发展迅猛。随着近年来网络技术的飞速发展和用户操作水平的提高,证券公司证券交易、网络