论文部分内容阅读
说话人识别技术是随着信息技术而发展起来的一项身份认证技术,它涉及到多个学科的研究领域,而这些相关领域的进步又促进了这项技术的发展。随着智能化时代的到来,人们希望与计算机等智能化设备能够进行更方便、可靠的沟通。然而,现在大部分小型便携式智能化设备都需要输入密码,容易遗忘以及使用起来不方便,而说话人识别正好能够弥补这方面的缺陷。近些年来,说话人识别已经在理论及实验室的条件下达到了较高的精度,开始进入实际的应用阶段。因此,用DSP实现基于说话人识别的嵌入式系统就成为了当下研究的热点。本文首先介绍了说话人识别研究的背景和意义,以及与说话人识别相关的一些基本概念和分类,然后阐述了它的一些基本理论,包括语音产生的原理,语音的分析方法,在说话人识别中常用的特征参数及其提取方法,还有常用的说话人识别方法,接着介绍了系统开发所须的硬件平台,着重对说话人识别流程中的预处理、端点检测、特征参数提取与模式匹配等部分做了详细的讲解,最后将系统设计的算法在DSP平台上移植后,通过对算法的各个部分运行所用的时间以及存储空间进行统计来分析整个系统的性能。本文在TI的DSK5402平台上构建了一个6人的说话人识别系统,根据本系统的要求以及对常用说话人识别的特征参数和识别算法进行比较分析之后,采用双门限端点检测算法提取有效的语音信号,以MFCC参数与语音帧能量构成组合特征参数作为特征参数,改进的DTW作为模式匹配的算法。用MATLAB对系统所采用的算法进行仿真,以确定其性能的可靠性,并采用线性预测语音合成方法来实现提示输入识别语句、输出识别结果,从而节省更多系统内存,使用起来更加方便快捷。最后采用定点与浮点数据的转换,改变访问数据的长度以及使用内联函数等手段对软件系统进行优化,并成功实现了系统的自举运行。实验证明系统在指定文本的说话人闭集测试中取得满意的效果。本系统具有使用方便,速度较快、识别率基本上满足设计的要求,然而,也存在一些需要改进的地方,例如,本系统是在实验室的环境中进行测试的,并没有考虑抗噪性的问题,因此,在进一步的研究中,我们应该将噪声的影响考虑进来。另外,我们的系统只适用于文本有关的说话人识别,因此使用的范围比较狭窄,下一步应该从文本无关的角度进行设计,使本系统能够应用于更多的领域。