论文部分内容阅读
语音识别是人机智能接口领域的研究热点,本文就小词汇量汉语孤立词识别的理论与技术进行了系统的研究。分别在语音库建立、语音去噪、端点检测、识别方法及软硬件实现等5个方面取得了较有成效的进展。建立了一个标准化的小型语音库,组织和完成了语音样本的采集工作,为算法测试奠定了物质基础。比较和分析了现有的各种语音去噪理论和算法,表明基于软阈值的多尺度小波去噪方法优势明显。对端点检测方法的比较性研究表明,在高信噪比条件下,宜选用运算量较小的能量和过零率方法,而在低信噪比情况下,宜选用鲁棒性较好的自相关、线性预测误差或倒谱距离方法。基于查找表和矢量量化操作,通过构造失真测度表和哈希查找函数,改进了传统的动态时间规整识别算法,在保证识别率没有明显下降的前提下大幅度降低了时空复杂度。利用汉语声韵母的结构特点,将传统的矢量量化方法改进成分段矢量量化方法,提高了量化操作的精度和刻画特征矢量空间的能力,理论上证明了该方法没有增加算法的复杂度,是一种较理想的孤立词识别方法。提出了分段准隐马尔可夫模型,很好解决了传统隐马尔可夫模型在模式训练过程中出现的数据稀疏和数值下溢问题,是小样本条件下传统隐马尔可夫模型的简易形式。分别以MATLAB和RSC-300芯片为平台开发了语音识别的软件和硬件系统。目前硬件系统可以准确稳定识别50个湖南地名,并作为“铁路机车信息控制系统”预研项目的组成部分处于论证测试阶段。