论文部分内容阅读
随着以数字技术为代表的信息时代的来临,人机交互的场合越来越多。摒弃键盘和鼠标,实现人和机器的自然通信,一直是人类长期以来追求的目标。在计算机应用广泛普及的今天,人机之间进行语音交流已成为人机交互技术中的重要研究课题。语音识别是一个交叉学科,具有极广泛的应用领域。目前,语音识别的应用多是特定人孤立词语音识别系统。在总结研究现有语音识别方法的基础上,提出了新的端点检测算法——短时能量-排列熵端点检测法,搭建了一个基于DTW的语音识别系统,并在系统中实现了短时能量-排列熵端点检测法。端点检测是语音识别技术中的一个重要组成部分,有效的端点检测不仅能减少处理时间,而且能排除无声段的噪声干扰,提高系统的识别性能。短时能量法对能量大小的变化很敏感,但在低信噪比的情况下检测效果不理想;排列熵可以有效表示信号变化趋势,但单独使用排列熵很难有效判定端点。提出了一种新的能量-排列熵端点检测算法,使用短时能量和排列熵两个特征,通过双门限判别法判断端点,提高端点检测的准确率。实验结果表明,短时能量-排列熵算法优于短时能量法和排列熵法。语音识别系统的实现,包括预处理,端点检测和特征提取部分算法,以及语音识别系统的核心问题——语音识别算法的实现。在Matlab平台上,用汉明窗进行分帧加窗,配以短时能量-排列熵端点检测算法,然后提取MFCC特征参数,使用DTW识别算法,实现了一个小词汇量特定人孤立词语音识别系统。