论文部分内容阅读
语音是人类交流与沟通的最主要方式之一。随着语音技术的进步,手机、掌上电脑等逐渐被人们所熟知,无线通信及网络的普及,语音产品担任新一代智慧型产品与人类之间沟通的主要界面。语音识别产品对实时性和集成度要求较高,采用数字集成电路设计及其嵌入式系统的设计方法,实现嵌入式实时语音识别系统具有重要研究意义。本文首先介绍语音识别原理的主要算法,包括MFCC算法、向量量化算法、矢量量化算法、前向-后向算法和维特比算法。利用HTK调用Matlab建立0-9之间十个数字隐马尔科夫模型(HMM)的语音识别系统,设定梅尔频率倒谱系数(MFCC)的参数为13维,对语音进行特定人和非特定人训练和识别,特定人识别率为85.33%,非特定人识别率是75.12%。利用VC调用HTK建立界面化的语音识别系统,完成特征参数提取和识别结果显示,将训练语料库下载到现场可编程门阵列(FPGA)的SD卡中,作为实时语音识别系统的比对库。本系统设计采用定制的SOPC系统,将C语言模块集成到NIOS-II系统中,设置自行定义的IP核和多个并行输入输出(PIO)接口,实现硬件模块与嵌入式系统的互连,充分发挥SOPC系统在数字信号处理中并行运算优势。采用FPGA的SOPC技术建立嵌入式实时语音识别系统,将整个系统集成到单一芯片上,芯片选择DE2-70EP2C70F896C6,完成实时语音输入到语音识别结果实时显示。实验结果表明,语音识别系统识别结果与软件识别结果完全一致,语音识别系统在FPGA上执行时间比软件仿真时间快近26倍,满足语音识别系统的实时性要求。