基于BP神经网络的语音识别研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:down222
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别技术具有重要的理论价值和广阔的应用前景,近年来受到了人们的广泛重视。随着电子计算机的不断应用与发展以及人工智能的不断进步与完善,人们越来越希望让机器能够理解人类的自然语言,这种需求使得语音识别技术的研究与发展十分迅速。一直以来,语音识别研究大部分以线性系统理论为基础,主要包括应矢量量化(VQ)、动态时间规整(DTW)与隐马尔可夫模型(HMM)等技术。然而,人的发音实际上是一个复杂的非线性过程,基于线性系统理论的语音识别方法的局限性渐渐显露出来。语音识别技术若要取得突破,必须引入非线性理论的方法,人工神经网络(ANN)就是非线性理论中的一种有效方法。近年来,随着人工神经网络,特别是BP神经网络等非线性理论研究与应用的逐渐深入,使这些理论应用于语音识别成为可能。   本文以语音识别技术和BP神经网络理论为基础,结合MATLAB工具,研究了BP网络模型在语音识别中的应用问题。论文首先介绍了国内外语音识别研究的历史现状和发展趋势,接着阐述了语音识别和BP网络基本原理,然后基于MATLAB与BP神经网络构造和设计了语音识别原型系统,对系统设计原理和实现过程进行了详细介绍,最后进行了仿真实验和结果分析,并根据实验结果进行了算法改进和系统优化,使系统的识别率与识别速度显著提高。本文主要研究了基于BP神经网络的汉语语音识别,对语音识别的主要过程和BP神经网络的构建进行了详细说明,研究构造了相应的语音识别模型与算法,完成了实验软件平台的搭建与开发,设计了基于MATLAB与BP神经网络的语音识别系统,并对系统进行算法改进和结构优化,大大提高了识别性能。实验结果显示,改进和优化后的系统具有更好的识别性能,训练时间也进一步缩短,达到了预期的效果,为将来移植到嵌入式系统打下了良好的基础。最后,文章在语音识别系统的基础上,与视频检索技术相结合,研究了基于语音识别的新闻视频检索系统的实现途径,并给出了系统框架和概要设计。
其他文献
随着经济和社会的快速发展,人们对软件的数量需求不断增加的同时,对软件的质量和可靠性也提出了更高的要求。但是现今大部分软件仍然是工人凭着经验和技能编制出来的,往往不能确
强制访问控制能有效地防止用户有意或无意地破坏系统的安全,能够有效地防止病毒和木马以用户的身份破坏系统的安全,是高安全需求操作系统的主要防护手段。业界对操作系统强制访
随着集成电路制造工艺向超深亚微米和纳米级推进,芯片集成度大幅提高,嵌入式随机访问存储器(RAM)逐渐成为集成电路芯片的主体。由于高密度嵌入式RAM的成品率直接影响着芯片的成
随着社会、经济的发展,人们认识问题的复杂性、不确定性持续增加,这就导致表征事物行为特征的数据往往不是一些确切的数,而是一些带有一定误差的取值范围,我们称之为区间数,
随着机器人研究的深入和机器人领域的拓展,许多恶劣、危险环境下的作业,都需要由作机器人完成。这些作业一般都比较复杂,由于受机器人技术水平的限制,目前机器人很难自主完成这些
软件成本估算领域经过四十余年的发展,涌现出一大批估算理论与方法,但都没有在现实环境中的软件企业中得到广泛应用,在项目早期进行软件成本估算仍旧是一件非常难的任务。由于估
社会网络分析(Social Network Analysis,SNA)是使用量化方法对社会网络进行分析,研究其中个体和网络特性的学科。近年来,随着Internet的发展,大量社会网络数据的出现,尤其是由网络行
逆向工程以其在产品设计和研发中的独特优势,得到了广泛的研究和应用。作为其中的两项关键技术,点云数据简化和曲面重建具有重要研究价值。如何有效地缩减点云数据的规模并在
ICRH(Ion Cyclotron Resonance Heating)天馈线远程控制与状态检测系统是EAST-ICRH控制子系统之一。基于FPGA的天馈线远程控制与状态检测系统实现解决了新型ICRH天线和传输系
射频识别(RFID)是一种利用无线射频的远距离通信方式实现的非接触式的自动识别技术,和其它识别系统相比较具有速度快、实时性强、采集准确性高等优点。随着技术的发展,RFID系