【摘 要】
:
说话人识别作为语音信号处理技术的一个代表和重要组成部分,近几年来,日益成为当今的一个研究热点,在电子商务、消费、银行等远程客户服务的身份认证,军事安全领域的说话人身
论文部分内容阅读
说话人识别作为语音信号处理技术的一个代表和重要组成部分,近几年来,日益成为当今的一个研究热点,在电子商务、消费、银行等远程客户服务的身份认证,军事安全领域的说话人身份自动检测认证中具有极大的应用价值和广泛的应用前景。它是一种基于生物特征信息的身份识别方法,通过对说话人的语音进行分析,从而对说话人身份做出正确识别和判断的一项研究。依据判别方式的不同(一对多,一对一),说话人识别可以分为说话人辨认和说话人确认。随着交互技术和信息技术的飞速发展,说话人识别开始越来越受到大家的关注。本论文主要做的工作如下:首先,本文针对说话人识别的前端处理方面进行了相关研究,得出并实现了一个比较合理的处理算法;其次,讨论不同语音特征向量的提取方法,最终得出针对说话人识别而言比较合理的特征向量:美尔倒谱系数(MFCC)。在成功提取出MFCC的前提下,讨论了MFCC各维参数对最终结果的贡献;再次,在识别模型的训练方面,主要研究高斯混合模型的模型训练,在这种训练方法中,主要讨论了最大似然估计算法,期望-最大化算法以及最大模型距离法;再其次,在性能研究方面,研究了不同高斯混合密度下说话人辨认系统的识别率,认为高斯密度个数的选择与训练语音数据量具有相关性。同时验证了其他其它几个与识别率有关的参数因素与系统性能关系;最后,搭建了一个说话人识别系统用于试验测试,验证了一些参数对性能的影响,同时使用了多线程并行处理技术,以此缩短识别时间:并提出了一种放大特征向量差距,变换特征向量在特征空间的分布来提升大容量语音库中说话人识别率的方法。
其他文献
《荀子》是先秦诸子中一部富有语言特色的传世典籍,其文献真实性强,词汇量大,为研究上古汉语词汇提供了重要的语料。同义关系是词汇中特殊而重要的一种类聚关系。本文在借鉴前人
晋祠是一个集佛教、道教、儒家多种文化影响的综合性祠堂,它汲取中国古建的精粹、融合多种文化,建筑格局随地形的多变而因势利导,形成了错落有致、独具特色的多元建筑文化格局。
芭蕾舞剧《红色娘子军》,是以西方芭蕾舞技术为基础,以中国芭蕾舞演员为核心的一部优秀的"中国式芭蕾舞剧"。该剧将政治色彩淡出、艺术色彩凸显,音乐与动作有机结合,体现思想
智能的正常发展是心理健康的基础。良好的个性、良好的处世能力和良好的人际关系是心理健康的必要条件,它们的完美结合即构成心理健康的理想模型。目前我国教育机构还有相当
作为一种新型换热流体,纳米流体得到了越来越多的关注。纳米制冷剂是纳米流体的一种,其特征是主流体为制冷剂。为了较好地利用纳米制冷剂增强制冷系统的性能,所以需要研究纳
《普通高中生物课标》中指出:“了解建立模型等科学方法及其在科学研究中的作用,培养学生的建模思维和建模能力”。《标准》将“模型”知识列为课程的知识目标之一,说明新课
目的比较辅助化疗XELOX方案与FOLFOX方案在Ⅱ~Ⅲ期结肠癌患者的临床疗效、不良反应及生活质量的差异。方法选取2011年1月至2013年1月我院行根治性手术的120例Ⅱ~Ⅲ期结肠癌患者
<正> 在发生近视的环境因素中,学生看电视不良卫生习惯是引起视觉疲劳,并从而导致近视的原因之一。本文就大庆乙烯地区1771名中小学生看电视与近视的关系进行调查,其结果报告
<正>焦炭、电力、冶金是与煤炭紧密的相关产业,随着山西能源重化工基地的开发,焦炭、电力、冶金行业得到了迅速地发展,成为山西的支柱产业。回顾山西能源重化工基地的建设,有
流域是地表水及地下水分水线所包围的集水区域的统称,是一个由自然、经济和社会复合而成的巨系统,建立以流域为单元、以水资源综合开发利用为核心的流域统一管理体制是促进流