基于DTW的说话人识别及其在DSP上的实现

被引量 : 0次 | 上传用户:terrychang2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别技术是随着信息技术而发展起来的一项身份认证技术,它涉及到多个学科的研究领域,而这些相关领域的进步又促进了这项技术的发展。随着智能化时代的到来,人们希望与计算机等智能化设备能够进行更方便、可靠的沟通。然而,现在大部分小型便携式智能化设备都需要输入密码,容易遗忘以及使用起来不方便,而说话人识别正好能够弥补这方面的缺陷。近些年来,说话人识别已经在理论及实验室的条件下达到了较高的精度,开始进入实际的应用阶段。因此,用DSP实现基于说话人识别的嵌入式系统就成为了当下研究的热点。本文首先介绍了说话人识别研究的背景和意义,以及与说话人识别相关的一些基本概念和分类,然后阐述了它的一些基本理论,包括语音产生的原理,语音的分析方法,在说话人识别中常用的特征参数及其提取方法,还有常用的说话人识别方法,接着介绍了系统开发所须的硬件平台,着重对说话人识别流程中的预处理、端点检测、特征参数提取与模式匹配等部分做了详细的讲解,最后将系统设计的算法在DSP平台上移植后,通过对算法的各个部分运行所用的时间以及存储空间进行统计来分析整个系统的性能。本文在TI的DSK5402平台上构建了一个6人的说话人识别系统,根据本系统的要求以及对常用说话人识别的特征参数和识别算法进行比较分析之后,采用双门限端点检测算法提取有效的语音信号,以MFCC参数与语音帧能量构成组合特征参数作为特征参数,改进的DTW作为模式匹配的算法。用MATLAB对系统所采用的算法进行仿真,以确定其性能的可靠性,并采用线性预测语音合成方法来实现提示输入识别语句、输出识别结果,从而节省更多系统内存,使用起来更加方便快捷。最后采用定点与浮点数据的转换,改变访问数据的长度以及使用内联函数等手段对软件系统进行优化,并成功实现了系统的自举运行。实验证明系统在指定文本的说话人闭集测试中取得满意的效果。本系统具有使用方便,速度较快、识别率基本上满足设计的要求,然而,也存在一些需要改进的地方,例如,本系统是在实验室的环境中进行测试的,并没有考虑抗噪性的问题,因此,在进一步的研究中,我们应该将噪声的影响考虑进来。另外,我们的系统只适用于文本有关的说话人识别,因此使用的范围比较狭窄,下一步应该从文本无关的角度进行设计,使本系统能够应用于更多的领域。
其他文献
李白是一位伟大的浪漫主义诗人。李白的一生是充满悲剧的一生,他的诗歌表现了他一生怀才不遇、与黑暗现实和权贵格格不入的悲情浪漫主义精神。本文试从李白的悲剧人生和浪漫
随着云计算技术的快速发展,SAAS(Software-as-a-Service)模式得到了越来越多用户的青睐。在SAAS模式中,供应商把软件作为一种服务出租,企业按需订购,这比传统的软件销售模式有着
黄河首曲玛曲是黄河上游重要的水源补给区和调蓄区,素有高原水塔之称,其境内也存在者大面积连成片的最具代表性、最原始的高寒沼泽湿地,也是世界上保存最完整的自然湿地之一。境
言语行为研究一直是语用学、尤其是跨文化语用学研究的焦点。抱怨在人类交际中是一种威胁听话人面子的言语行为。来自不同文化的人受社会变量的影响不同,采用的表达模式不尽相
<正> 1986年2月,统治菲律宾20年之久的马科斯政权垮台了,马科斯本人被迫流亡夏威夷。这成了1986年世界重大事件之一,在第三世界甚至对超级大国都发生了重大影响。本文试图对
近年来,随着生产力的不断发展,财富积累更加集中,人口也更加密集,导致诱发火灾的因素增加,造成的损失更加严重。消防技术的不断更新是减小财产损失的重要手段之一,也是加强公共财产
凤凰单丛茶是我国名优乌龙茶的主要代表之一,产自潮安县凤凰镇。本文主要就凤凰单丛茶的产业发展、栽培管理技术特点以及研究利用等方面的情况进行综述,旨在为凤凰单丛茶今后
极限概念有着深刻的思想性,它包含了事物的无限运动变化过程和无限逼近思想,体现了由有限到无限、近似到精确、量变到质变的辩证思想,曾对教学发展和促进人类文明发挥过十分
灭菌液阴道冲洗防治宫颈癌放疗并发症的初步观察荆保国,梁玉新(广东医学院附属医院放疗科,湛江524001)对于宫颈癌失去手术机会时放射治疗是一种有效的治疗方法,但放疗中发生的某些并发症
目的:1.构建WWOX基因过表达慢病毒重组质粒载体并完成相关鉴定;2.研究上调WWOX基因对人Jurkat及K562白血病细胞生物学特性的影响;3.初步探讨其生物学特性改变的相关分子机制。方