基于声门特征的说话人识别研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户：wsw12345ok

【摘要】

：

说话人识别技术被认为是最自然的生物认证技术，它是一项根据语音中反映的说话人生理和行为特征的语音参数，自动识别说话人身份的技术。目前，说话人识别的主流特征往往只反映了说

【作者】

：

杨璞

【机构】

：

浙江大学

【出处】

：

浙江大学

【发表日期】

：

2005年期

【关键词】

：

说话人识别声门特征噪音多通道

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

说话人识别技术被认为是最自然的生物认证技术，它是一项根据语音中反映的说话人生理和行为特征的语音参数，自动识别说话人身份的技术。目前，说话人识别的主流特征往往只反映了说话人的声道频率特性，而忽略了声门的振动信息，以及声门振动对于声道的潜在影响。在详细分析说话人识别的主要特点和最新进展，特别是基于声门特征的说话人识别研究现状的基础上，本文针对如何更好的在说话人识别中利用声门特征进行了大量的尝试，提出了相关的模型和算法。本文的主要工作集中在以下三个方面：第一，针对声门和声道之间的相关性，提出了消除声门振动对说话人倒谱特征影响的模型和补偿算法。我们认为未受到声门振动影响的倒谱特征更具有说话人区分性，并且在说话人识别中同时使用长时(long-term)和短时(short-term)的声门特征，得到“补偿”过的倒谱特征。算法在理想环境下提高了说话人识别系统的性能。另外，鉴于声门特征的相对鲁棒性，我们将该倒谱补偿算法推广到复杂多通道的环境中，在303人的SRMC库上取得了令人满意的效果。第二，针对声门和声道在短时(short-term)上存在相互依赖的关系，我们在模型层次上提出了利用该相关性的算法——并行高斯混合模型(Parallel GMMs)。基于声门特征和声道特征独立的假设，传统的说话人模型往往忽略了由此可能带来的说话人自身(intra-speaker)距离对于系统区分度的影响。与传统的模型不同，并行高斯混合模型将短时声门特征和声道特征进行联合利用，在具有声门特征的先验知识的前提下，用概率统计模型来模型化这种关系，从而具有更优良的性能。第三，提出了在噪音环境下利用声门特征的补偿方法——基于声门特征的倒谱平均减(GIBCMS)。背景噪音以及通道的存在，使得训练环境和测试环境发生失配，导致说话人识别系统性能的急剧下降；倒谱平均减(CMS)是一种用来消除语音噪音／通道失真的标准化技术。本文提出的GIBCMS算法考虑到声门特征对于噪音／通道的相对鲁棒性，将其作为对语音信号进行非线性划分的标准，用于通道的非线性建模；在没有先验的通道频率响应知识的情况下，大大提高了倒谱平均减技术消除噪音／通道失真的准确性。该算法在SRMC库的各个通道上，性能都有所提高；而在信噪比为5dB的YOHO库上，识别率提高了约18％，明显优于其他倒谱平均减算法。本文得到以下基金资助：国家自然科学基金(6027305)、浙江省自然科学基金青年科技人才培养专项基金(RC01058)、浙江省自然科学基金(M603229)、博士点专项基金(20020335025)。

其他文献

基于有限能量的无线传感器网络协议研究

近年来，随着微机电技术(MEMS)、无线通讯技术和数字电子技术的发展而出现了许多新的信息获取和信息处理方式，无线传感器网络是其中之一。无线传感器网络是无线Ad hoc网络的一个

学位

无线传感器网络AgentAd hoc网络

群智能的双率系统的状态与参数估计

针对多率系统(Multirate system)的辨识研究多采用传统的递推辨识算法，近年来，随着科学技术和辨识理论的不断进步和发展，对复杂系统辨识方法的探索以及对辨识方法在收敛性、准确

学位

状态空间模型双率系统群智能算法参数估计状态估计

多维数据可视化中快速缓存算法的研究

数据仓库是近年来兴起的一种新的数据库技术,它弥补了传统关系型数据库对分析型环境的支持不足,数据仓库面向分析型环境,对企业的分析决策提供了强有力的支持。企业纷纷建立

学位

多维展现缓存物化视图选择

基于四元小波变换的多分辨率动态时空域模型的视频分割算法的研究

如何从背景复杂的视频中较为准确地分割得到目标是视频分割研究领域的一个重要问题。目前对视频分割算法的研究已经越来越广泛，主要存在着两大类的分割算法，分别是基于背景建模

学位

视频分割四元小波变换时空域显著模型模糊c-均值聚类Graphcut框架

面向用户的网格资源监控服务系统的研究

网格资源监控是网格动态负载均衡策略的基础,为用户定位故障,分析系统性能提供重要的性能数据,还可以直接供其它应用程序调用以降低程序设计的复杂度,增加应用程序的可移植性

学位

网格网格资源监控面向用户网格服务Globus

构件化软件集成测试体系结构研究

基于构件的软件开发(Component-Based Software Development CBSD)方法是继面向对象的设计方法之后,正在并逐步走向成熟的新的软件开发技术[1]。构件作为对外提供特定服务的

学位

体系结构构件集成测试XML构件合约包装器

中国象棋计算机博弈中的增强学习研究

计算机博弈曾一直被称为是人工智能研究的“果蝇”，但对于有几千年历史的中国象棋的计算机博弈的研究却远远落后于其它棋类，为了改变这种局面，东北大学成立了“棋天大圣”中国象

学位

中国象棋计算机博弈评估函数人工神经元网络时间差分学习增强学习算法

基于可信代理的访问控制模型研究

随着计算机技术的发展，计算机网络中各种攻击手段层出不穷，网络信息系统的安全性、可靠性和可用性等问题变得越来越重要，而可信计算技术能够有效的解决这些问题。因此，研究实现安

学位

可信存储访问控制保密性完整性可信平台模块代理

逆向物流管理问题的建模与优化

高新技术的迅猛发展提高了生产效率,缩短了产品更新换代的周期,加剧了市场竞争的激烈程度。当各种丰富的产品进入市场时,也就意味着有大量的使用后产品需要处理。这不仅关系

学位

逆向物流随机规划层次分析法产品拆卸树

基于RBAC技术的银行电子设备管理系统的设计与实现

访问控制是信息安全技术中的一个重要组成部分，对于大型分布式系统也是不可或缺的基本安全服务。本文结合一个银行电子设备管理系统的开发过程，在RBAC(Role-Based Access Contr

学位

安全访问控制RBAC分布式系统银行电子设备管理系统

基于声门特征的说话人识别研究

其他学术论文