论文部分内容阅读
随着移动互联网的快速发展和普及,移动终端越来越贴近人们的日常生活,更自然的人机交互方式就显得很重要。而语音识别技术为更好的人机交互提供了可能性,使其更自由和更方便。虽然现在语音识别技术目前已经发展得比较成熟,但是仍有较大的研究空间,比如提高识别系统的速度和识别率等。本文研究了语音识别主要的算法,利用HTK工具搭建了一个小词汇量的连续的非特定人声的语音识别系统,模拟了房间主要电器件的声控应用场景。通过对语音数据前端的滤波和端点检测处理和对系统进行了改进和优化,达到了能够应用于实际场合的程度。 本文首先介绍了语音识别的基本原理模型,详细讨论了语音信号的处理原理和特征参数提取的过程,确定MFCC作为识别参数。并且深入研究了HMM的三个基本的算法:前向后向算法、Viterbi算法、Baum-Welch算法。设计基于HTK的语音识别系统,包括平台和工作环境的的搭建,前期处理中通过滤波来降低环境噪声和采用改进的双门限端点检测方法进行语音段的检测。利用HTK工具包进行了对语音样本的训练,并将训练出来的模板运用语音识别引擎进行识别。