基于GA-ACO算法和BP神经网络的语音识别研究

来源 :湘潭大学 | 被引量 : 0次 | 上传用户:hyh900
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音作为人与人之间彼此交流最为重要的一种工具,在人工智能的组成中起到了极为重要的作用。随着计算机技术和通信技术的快速进步与发展,使它在各个行业中有着很好的前景,所以备受人们的重视,历来它都是根据线性理论来研究的,我们经常使用的方法就是动态时间规整技术(DTW)和隐马尔可夫模型(HMM)。当然,语音识别过程并不是一个简单的线性过程,其非线性使得利用线性理论来识别的方法的缺陷慢慢都展现出来了。近年来,人们对神经网络的研究越来越多,对其非线性理论更加了解了,把其用于语音识别中,能够得到更好的效果,因此,它也成为了如今研究的焦点。本文通过分析语音识别中的预处理、特征提取以及模式训练及匹配流程,发现最常用的方法有:预处理包括滤波采样、预加重、分帧加窗和端点检测。特征提取中阐述了线性预测系数(LPC)、线性预测倒谱系数(LPCC)和MEL频率倒谱系数(MFCC)三种基本方法。模式训练及匹配中阐述了动态时间规整算法(DTW)、隐马尔科夫模型(HMM)和神经网络模型(ANN)。本文主要就前馈神经网络(BP神经网络)的原理及其在语音识别的应用上进行了深入研究,针对该方法的不足之处,提出了将GA-ACO融合算法与其相结合,优化后的BP神经网络克服了传统BP神经网络收敛速度慢,存在局部极小值,动态性能不够理想,学习精度受一定的限制的不足,提出了一种新的方法来实现语音识别,而且在文中用此方法进行了MATLAB仿真实验,验证了其可行性。对于非指定人、单独数字的辨认,本文按照语音识别的基本方法,考虑到BP神经网络的缺点,用GA-ACO融合算法对其训练,形成了新的语音识别方法,并仿真了用新方法和传统BP神经网络方法进行语音识别的不同结果,而且讨论了不同特征参数、训练集、隐含层神经元个数对辨认精度的影响。研究结果表明,本文提出的基于GA-ACO融合算法的神经网络识别方法显示出其快速学习网络权值的能力,能够消除传统BP算法容易陷入局部极值和如何选取算法初始权重值来快速达到设定精度的困扰,从各个方面都能够比传统BP算法效果更好,有较高的辨认精确度,能够更好地投入到应用中。
其他文献
作为智能交通系统的一项关键技术,运动汽车跟踪已成为计算机视觉领域一项充满活力的研究课题。如何充分发挥运动汽车跟踪技术的优势,尽可能提高车辆跟踪性能,逐渐成为近年来的研
随着移动WiMAX网络(802.16e)与蜂窝广域网、B3G/4G技术的融合,集成移动WiMAX技术的支持多模功能的智能手机在移动状态下将能随时随地接入互联网与亲戚好友进行视频对话,收看IPT
在传统的语音增强系统中,信息的采集都是按照奈奎斯特采样定理完成的。按照此定理,采样到的数据包含了原信号的所有信息,能够精确重建原信号,但是却存在着很大程度上的冗余。
感知无线电技术能够很好地解决目前存在的频谱匮乏问题,充分利用了空闲频谱资源,极大程度上提高了频谱利用率。由于频率划分和使用政策的约束,授权用户在使用频谱资源时具有优先
在恶劣的天气条件下,如存在雾、霾等环境因素的影响,大气中这些微小粒子的散射和折射作用于成像系统,会导致获得的图像色彩饱和度和对比度下降,从而丢失很多重要细节信息,不
石英玻璃材料具有诸多优良特性,如制造成本低、极低的光学损耗、较高的光学损伤阈值,在现代光电子学以及光纤通信领域有着广泛的应用。由于石英玻璃材料的宏观中心反演对称性,石
穿墙雷达目标成像是室内复杂环境感知的关键,超宽带雷达因为其具有的高距离分辨率、强穿透能力,强干扰能力,在许多军事、执法等领域得到广泛应用。由于室内环境中目标的存在,
混合蛙跳算法(SFLA)是2003年由Eusuff和Lansey提出的一种基于群体智能的后启发式计算技术,它通过模拟青蛙群寻食的行为来解决最优化问题。由于概念简单、参数少、计算速度快、
随着GPS定位技术的发展,GPS定位精度日益提高,利用载波信号精确测量载体的姿态成为GPS应用中一个新的研究方向。论文针对载波相位测量相对定位理论,对基于GPS的单基线二维姿态测
语音信号是人类交流过程中形成的一种特殊的音频信号,是人类思维的一种依托。语音信号处理是数字信号处理和语音学等学科的交叉学科,受到这些学科的技术影响也随学科的发展而