论文部分内容阅读
语音识别拥有可观的应用背景,同时作为一个交叉学科也具有深远的理论研究价值。本文分别采用动态时间规整模型和隐马尔科夫模型,实现了孤立词语音识别方案。并探讨语音识别在硬件上的实现以及基音周期估值等具体问题。 语音识别的理论模型对系统的构建具有指导意义,本文首先分析了语音识别系统的层次结构,阐明不同任务的模型选取问题。然后按照方案处理的步骤详细的论述了语音识别的流程,并应用动态时间规整模型实现孤立词识别。 隐马尔科夫模型对时间序列具有很强的建模能力,通过对时间序列的特征参数的训练,为每个语音建立一个隐马尔科夫模型。待识别语音通过与各个隐马尔可夫模型匹配,即得到识别结果。论文在Windows平台上仿真和编写了预处理、端点检测、特征参数提取、K均值聚类法初值设定、语音模板训练、隐马尔可夫模型识别几个子程序模块,实现了语音识别的各个过程。并用汉语数码识别验证了办案的可行。 文章最后探讨了语音识别算法在硬件平台上的移植,重点考虑流程的改变、数据的处理和算法实时实现几个问题。结合FPGA特点,讨论简化短时自相关函数法实现基音周期的估值,并介绍单bit方法应用于语音信号频域分析。