基于RBF神经网络的语音识别研究

来源 :河北工业大学 | 被引量 : 10次 | 上传用户:3pei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别由于其重要的理论价值与广阔的应用前景,受到人们的广泛重视。到目前为止,语音识别研究大部分以线性系统理论为基础,随着研究的逐步深入,发现语音识别若要取得突破,必须引入非线性理论的方法。从20世纪80年代开始,随着人工神经网等非线性理论研究和应用的逐渐深入,将这些理论应用于语音识别成为可能。RBF(Radial Basis Function, RBF)神经网络为多层前馈式神经网络的学习提供了一种新颖而有效的手段,它的研究和应用在近年来得到了迅速的发展。本文基于RBF神经网络,对语音识别的预处理、特征提取与识别算法等环节进行了计算验证,性能分析和结果评述。基本的RBF神经网络是一种三层前馈网络,其收敛速度大大高于一般的BP网络,且网络拓扑可以在算法中确定。设计中存在的主要问题包括隐层神经元数、中心和半径的确定,以及网络权值的训练。本文采用的网络构建方法为:采用竞争算法和聚类算法相结合的混合算法动态选择隐层神经元数;用梯度下降法找出使代价函数最小的权值参数;从节省资源的角度出发,本文采用了Akaike的最终预报误差标准FPE删除那些对网络输出贡献较小的节点以取得网络精度与复杂度的平衡,直至FPE不再下降,停止筛选并计算网络最优权值,从而得到了一个合理的网络。另外还实现常用的迭代法、随机固定法训练的径向基网络结构和概率神经网络结构。文中用双门限法端点检测后用Mel频率倒谱系数MFCC提取语音特征参数,动态时间规整后输入构建好的RBF网络结构,用训练数据进行学习网络,网络训练完毕后将测试样本输入已训练的网络进行识别。对语音库中的纯净语音和带噪语音识别结果显示,改进后的RBF网络在识别率和识别速度上都有了显著提高。
其他文献
SIP(Session Initiation Protocol)最初是为管理多媒体会话过程而提出的,现在已经成为VoIP(Voice over IP)系统建设中最被看好的信令控制协议。扩展SIP协议栈以适合电话应用,
混沌是指在确定性非线性系统中出现的类似随机的行为,混沌系统的特性符合现代密码学的特征,而且它具有类似噪声的特性,具有天然的隐蔽性,将混沌应用于信息安全领域有着十分广
随着多媒体技术的应用越来越广泛,人们对视频图像质量的要求越来越高,视频压缩技术已经成为产业界关注的焦点之一。H.264/AVC是由ITU-T的VCEG组织和ISO/IEC MPEG两大国际组织
以嵌入式计算机为技术核心的嵌入式系统是继网络之后,又一个IT领域新的技术发展方向。由于嵌入式系统具有体积小、性能强、功耗低、可靠性高等特点,目前已经广泛的应用在国防、
目前,灾害应急与救助技术是世界各国广泛研究和探索的一个重大课题。本论文“电子鼻在人体气味检测中的方法机理研究”来源于四川省应用基础研究“灾害救助生命搜索理论与方法
本学位论文来自于“电力信息通信网络智能管道多维感知技术研究及应用”项目,研究目标为面向业务的流量识别与感知,主要内容为基于神经网络的网络流量识别算法研究,将神经网
RFID技术是一种无线识别技术,它不仅涵盖电磁场理论和微波技术,还综合了大规模集成电路、通信技术、EMC(电磁兼容)技术、数据保护和密码学、制造工艺等等学科,其本身所具有的
本论文的研究课题来源于江苏省科技型企业技术创新资金项目“基于多网融合的物联网综合监控系统研发”(No.BC2012006),主要研究工作为物联网监控网关的设计与实现。本文在分
学位
传统的电磁计算方法有其自身的缺点并受到作用域的局限,基于参数模型理论的特征提取方法迅速发展起来,已经被广泛地应用在雷达目标识别、地质勘探、地球物理、语音识别、声纳