论文部分内容阅读
语音是人类进行相互交流和通信最便捷的手段,在当今数字化的信息时代,用数字化的技术进行语音的增强、传送、识别、合成、存储已成为语音信号处理技术的科学前沿。语音识别技术是计算机技术的重要发展方向,语音识别已经形成了完整的理论体系,尽管目前语音识别的研究已经进入了商品化阶段,但在许多特定领域,由于其环境和行业的特殊性,往往需要专门进行开发,以适应社会需要。
在实际应用的场合中,语音识别的性能会随着说话人的变化、噪声的干扰、信道失真有较大的下降。在硬件实现方面,实时语音信号处理需要高速的硬件处理器,语音模板需要占用大量的存储空间,导致硬件成本提高,从而限制了语音识别技术的应用。本系统选用了TI公司的TMS320VC5402作为处理器芯片,选择对小词汇量语音识别系统进行研究。
实现小词汇量的语音识别主要包括以下三个方面的工作:端点检测、特征提取和模式匹配。在端点检测中,通过对过零率和短时能量参数的检测来判断起始点和结束点,去掉噪声,从而提取出语音信号数据。在特征提取中,首先对语音信号进行分帧、然后计算每帧语音信号的特征参数,本文采用线性预测倒谱参数作为特征参数,这些特征参数组成特征矢量,从而构成语音模板。在模式匹配中,采用了动态时间归整方法,将测试模板与参考模板进行匹配,比较两者之间的失真,得出识别判决的依据。
本文完成了基于DSP的小词汇量的语音识别系统的软硬件设计,并取得了较好的识别结果。为今后进一步研究中等词汇量以及大词汇量的语音识别奠定了基础。
论文最后总结了全文,指出了本系统的一些不足,并提出了下一步进行改善的一些设想。