基于矢量量化的与文本无关的说话人确认系统的研究

来源 :中南大学 | 被引量 : 0次 | 上传用户:xmingfu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会信息化程度的发展,越来越多的场合需要对人的身份进行可靠地识别,传统的以密码方式进行身份认证的技术日益暴露出很多弊端。为确保信息安全,用人特有的生物特征作为认证手段的技术逐渐发展起来。说话人识别属于生物认证技术的一种,是一项根据语音波形中反映的说话人生理和行为特征的语音参数,自动鉴别说话人身份的技术。说话人识别技术以其独特的方便性、经济性等优势受到世人瞩目,并日益成为人们日常生活和工作中重要且普及的安全验证方式。本文的研究对象是与文本无关的说话人确认系统。本文首先介绍了说话人确认的声学基础,研究了常用特征参数的提取方法以及基于矢量量化的说话人确认系统,提出了联合量化码本和平均量化误差作为表征说话人的模型,相应改变了距离测度的计算方法。对于说话人确认系统中存在的阈值难以确定等问题,提出了一种新的基于矢量量化方法的阈值的计算方法,该算法可以在训练时根据不同的用户得出不同的阈值,无需人为在系统中设定,与传统的经验阈值相比具有较好的鲁棒性。在Matlab下对改进后的说话人确认系统进行了仿真,研究了几种常用特征参数的优劣性,以及对系统性能的影响,根据仿真结果,设计了一个说话人确认系统性能测试平台,可方便研究系统性能,最后用C语言实现了系统的核心算法。在实验室环境下,建立了一个27人的与文本无关的语音库。理论和实验结果表明:加倒谱提升窗的Mel倒谱参数是常用特征参数中识别率高、计算量折中的参数,改进后的基于矢量量化的与文本无关的说话人确认系统与传统的基于矢量量化的系统相比具有更好的鲁棒性,误识率有显著的降低。系统的错误率较低,计算量较小,实时性好,可用在一般的身份确认场合,若用在高度机密的身份确认场合,要求错误接受率尽量低,系统的性能有待进一步的提高。
其他文献
课题来源于南通某生物制品公司蛋粉生产线技术改造工程项目,对蛋粉生产线设计开发了基于PROFIBUS现场总线技术的蛋粉生产监控系统。论文阐述了本监控系统的设计和实现过程并
由于近几年石化行业安全事故频发,其所造成的经济和人员方面的损失使得安全评价成为各国研究人员的一个重点研究课题。在各种安全评价方法中SDG-HAZOP方法因其高效且完备的分
加热炉燃烧过程是一种复杂的工业过程,具有多变量、非线性、时变、大时滞、难以建立数学模型等控制难点。空燃比和煤气流量是影响加热炉燃烧过程的重要工艺参数,如何确定合适的
人类感知外界事物很大方面是依靠视觉,双目立体视觉是模仿人类的视觉系统建立的一种仿生系统。目前,双目视觉已经广泛应用在生活和军事中。目标识别定位是机器视觉、智能人机交
随着机器人视觉技术的不断发展,机器人的应用领域不断扩大。随着人们对机器人视觉的要求越来越高,图像质量日渐清晰,随之而来的是机器人需要处理的数据计算量越来越大。为了减少
由于混沌具有对初始条件极端敏感、似噪声、连续宽频谱等特性,近年来在保密通信等领域得到了深入的研究和广泛的应用。但是,目前混沌控制和混沌同步理论并不成熟,还有很多理论和
鲁棒控制问题是控制学科的一个重要研究分支,近年来,鲁棒控制理论在海洋信息探测技术、空间技术、经济运行系统、智能机器人、化工等各个领域得到了越来越多的应用。鲁棒控制问
多芯电缆逐渐在各种设施中大量使用,而多芯电缆的性能直接影响系统的有效性,因此在电气安装及调试中掌握电缆的故障情况显得尤为重要。但当多芯电缆产生故障时,快速测量出电缆故
随着科技进步和生活水平的提高,人们对于生活品质的要求也日益提高。在这种情况下,智能家居系统的研究已经成为当前的热点。目前网络技术的大量普及和嵌入式Internet技术的发展