论文部分内容阅读
随着世界汽车工业的快速发展和嵌入式技术的不断进步,车载多媒体越来越多的出现在人们生活中。车载多媒体设备的交互方式需要很好的便利性和安全性,语音指令以其方便、快捷的特点成为交互方式的首选。实用化研究也是近年来语音识别的一个新兴研究方向,语音识别技术应用于车载系统将有力地促进车载设备方便、快捷、安全地使用和普及。本课题致力于车载多媒体语音指令控制系统的开发研究。针对嵌入式系统存在的存储空间有限和实时性要求高等问题,主要从语音识别算法的优化和车载多媒体语音指令控制系统平台的构建着手研究。(1)针对传统MFCC特征提取之后得到的语音特征矢量序列数据量很大,占用较多存储空间的缺点,采取矢量量化技术对特征矢量进行优化处理。仿真实验表明:语音信号经该算法处理后,数据的存储量减少近91%。(2)针对车载多媒体语音指令控制系统操作对象不唯一的特点,采用DHMM算法进行语音训练和识别,实现了非特定人语音指令控制。然而该算法的训练模块将会产生大量的语音数据,于是将训练过程在PC机上实现,且只需开发时在PC机上进行训练,以后的使用过程完全脱离PC机,节约并合理地利用了嵌入式系统资源。(3)研究了车载多媒体语音指令控制系统的软件平台。主要包括嵌入式软件开发环境的构建、启动引导程序设计、内核剪裁编译和移植、音频驱动程序的裁剪移植和根文件系统的制作等。同时还详细阐述了Qt/Embedded图形界面开发平台的特点和宿主机交叉开发环境的搭建过程。最终将系统的软件平台移植到ARM9开发板上,成功构建出车载多媒体语音指令控制系统的软件平台。(4)以构建的嵌入式系统软件平台为基础,在ARM9开发板上实现车载语音指令控制系统。操作者通过麦克风输入语音指令,识别后传送给车载系统,完成相应的指令操作。实验测试结果表明:程序运行速度快、可靠,界面设计合理,操作简便而舒适,符合人们的习惯,系统的识别正确率和实时性均满足了汽车对于车载多媒体的实用需求。