论文部分内容阅读
语音识别(ASR)是指机器通过识别和理解把语音信号转变为相应的文本文件或命令的技术,通过语音识别技术实现人机交互,可以使交互过程变得自然、高效。经过多年的发展,语音识别系统已显示出巨大的应用前景,同时也形成了完整的理论体系和识别模型。隐马尔可夫模型(HMM)就是其中一种,它是一种基于统计的模型,具有良好的识别性能和鲁棒性,因而被应用到很多优秀的语音识别系统中。
近年来,嵌入式技术的蓬勃发展为嵌入式语音识别应用带来了广大的市场需求。传统的DTW算法在进行非特定人识别时的性能不太令人满意,且识别过程运算量较大,对嵌入式平台实时应用来说是一种挑战,因此需要采取一种性能良好的算法,HMM则是一种不错的选择。但大多数基于HMM的语音识别系统都是在PC平台上实现的,因此研究在嵌入式平台下基于HMM的语音识别系统是十分必要而又有意义的。
本文通过对嵌入式语音识别原理和HMM模型研究,根据嵌入式平台语音识别系统研究流程,首先在PC平台上采用C语言设计与实现了基于HMM的语音识别算法,验证本文所设计算法的正确性,并对结果进行了简单分析。鉴于FPGA平台的诸多优点,本文采用嵌入式平台为FPGA。
通过对嵌入式FPGA平台的开发流程进行研究,设计了FPGA平台上的基于HMM的嵌入式语音识别系统方案,结合系统需求和算法本身特点,提出了系统的总体框架,并对系统进行了软硬件功能模块划分,设计了系统的软硬件框架、调度策略。
同时通过对嵌入式语音识别系统进行分析,提出了系统实现过程中的关键问题,如语音数据如何输入到FPGA中、信号分析模块算法如何实现浮点转定点计算以及为了保证识别实时性而采用硬件实现的Viterbi算法的硬件如何实现等,并针对这些问题分别给出了相应的解决方法,设计实现了一个嵌入式语音识别系统的原型。语音识别技术在嵌入式系统中的应用是当前的研究热点。
本文研究了嵌入式平台基于HMM的语音识别系统,对语音识别算法的嵌入式设计和实现做了有益的探索,对嵌入式语音识别的进一步研究具有积极的理论和实践意义。