论文部分内容阅读
说话人识别系统通过语音设备采集语音信号,然后对语音信号经过预处理并进行特征参数的提取,最后经过说话人识别的算法鉴别出说话人的身份。作为当今的一个研究热点,说话人识别有其广泛的应用前景,特别是在公安司法、金融以及信息服务等领域。针对目前说话人识别算法复杂度高,鲁棒性不强的问题,本文主要研究了说话人识别算法,并从实用的角度出发,设计并实现了基于嵌入式linux的说话人识别系统。本课题选用三星S5PV210作为核心处理器,并基于嵌入式linux系统搭建嵌入式平台。实现使用u-boot开发bootloader引导程序,对linux-3.0.8的内核进行裁剪和编译生成内核镜像文件uImage,使用nfs起根文件系统,最后的应用程序主要使用QT来开发最终的说话人识别的界面。在说话人识别系统实现方面,课题利用ALSA函数库实现语音的采集,实现对语音信号的预处理并且对处理过的语音信号进行特征参数的提取,最终再利用矢量量化(VQ)和高斯混合模型(GMM)的原理实现说话人识别系统,并且通过对其他的说话人识别系统比如隐马尔可夫(HMM)和人工神经网络(ANN)加深对说话人识别的认识和理解。同时本文使用频谱时间接受域(STRF)特征提取,该算法比Mel频率倒谱系数(MFCC)更符合人耳特性,从而提高系统的鲁棒性,但由于其识别率较低,因此可以融合MFCC,从而提高系统的识别率。以此同时对GMM模型进行改进,使用改进的EM算法和改进的遗传算法,最终将改进的STRF运用在改进的GMM模型上,实现本文算法目的。通过一系列的移植操作,将PC上实现的说话人识别系统移植到开发板上,实现其真正的实际应用。基于嵌入式系统的说话人识别系统具有实时性,专用性以及良好的用户界面等优点,为其在以后市场的使用奠定了实际基础。