基于EBF网络的特征映射器的研究及其在鲁棒话者识别中的应用

来源 :上海大学 | 被引量 : 0次 | 上传用户:u482366
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文在对神经网络、话者识别,尤其是鲁棒话者识别的研究现状和发展进行了认真详细的分析的基础上,利用神经网络构建特定话者的特征映射来改善话者识别系统的鲁棒性.这包括两个方面的改进工作:一是选择合适的神经网络类型,并对其参数进行优化,使其对于语音信号特征在样本空间中发生混叠时,仍然保持较好的样本表征能力;二是通过补偿的方式,对在不同环境或信道影响下发生畸变的失真信号予以恢复,使其更接近于未失真信号,从而提高可区分程度.该文从上述这两个方面出发,对基于EBF神经网络的鲁棒话者识别作了进一步深入的研究.主要工作包括:首先,该文比较并说明了RBF神经网络结构以及相对于BP网络在识别方面的优势,并对径向基核函数的选择作了进一步的讨论,由此引入了椭圆基函数(EBF)网络,它在RBF网络结构中全协方差矩阵取代原来的对角协方差矩阵,使之在不同的输入方向上的函数宽度也不同,能够在不增加基函数数目的情况下表征复杂的分布.其次,影响EBF网络性能的一个非常重要的因素是聚类.该文在分析了目前聚类的基本方法的基础上,指出以K平均法等为代表的分割聚类虽然理论上找到类的所有划分并使得目标函数最小就可以获得最优解,但由于对于相当尺度的数据集列举所有可能的划分并不现实,因而多数分割方法采用迭代优化技术作为变通.第三,该文在对期望值最大(EM)算法的思想、收敛性以及收敛速度问题作了认真细致的研究的基础上,指出EM算法在参数优化方面具有无须在每次迭代时都计算逆赫斯阵、接近于超线性收敛、无须设置步长参数就可以达到似然度的单调收敛等优点.基于这些优点,该文采用EM算法来优化EBF网络的均值及协方差矩阵参数,并给出了应用EM算法估计EF网络参数的具体公式.并且通过话者识别实验,表明利用EM算法优化的EBF网络,其性能要优于普通的RBF网络和EBF网络.第四,该文通过对鲁棒语音技术,尤其是通过电话线路的鲁棒话者识别技术的特点的分析,对鲁棒话者识别的补偿技术提出了一种新的设想和方法.最后,该文还将上述扩展的RPCL和EM算法结合起来,对EBF网络参数加以优化,并以此为基础开发了话者识别系统软件.该系统软件可以对语音数据库进行训练、测试和修改,也可以加入新的话者语音,自动地进行采样、特征提以和训练,并能够对未知话者的语音进行测试和判决,显示接受或拒绝未知话者.在现场试验中,该系统表现出识别性能良好,具有广阔的应用前景.
其他文献
该文采用的神经网络为BP网络,分析了训练BP网络所使用的各种算法.首先介绍了标准梯度下降法,以及在其基础上的改进算法;其次还介绍了基于数值优化的改进方法,该算法不仅利用
虚拟现实是利用计算机生成一种模型环境,通过各种输入设备使用户投入到该环境中,实现用户和该环境直接进行自然交互的技术。本文探讨了利用多种相关开发工具的协调,实现一个基于
管理信息系统的应用越来越普及,而其中的问题也越来越突出,已经引起广大研究者的重视.如何合理有效的解决好这些问题,对成功地开发出高效实用的管理信息系统将具有重要意义.
以提高非接触式ID卡门禁控制系统的处理速度为首要目的,本论文在分析当前门禁系统、智能IC卡技术和DSP等关键技术的基础上,提出了基于DSP芯片的快速门禁控制系统的设计思想。并
首先,论文依据能量平衡原理和费米能级的概念,详细分析了固体颗粒的激励荷电机理,讨论了影响荷电量的因素,并将固体颗粒的激励荷电方法与摩擦起电方法进行了对比,指出前者具
该论文主要研究了基于模糊Petri网(FPN)的电梯故障诊断方法.基于FPN的电梯故障诊断系统主要是利用模糊Petri网作为电梯故障诊断的知识表示方法和推理策略.该系统可以诊断的电
近年来,随着信息技术的不断发展,企业信息化、现代化的进程不断深入,ERP作为一种先进的管理思想和工具,逐步成为提高企业管理水平和竞争实力的重要手段。尤其,对于作为各产业核心
该论文主要针对基于PC的控制系统的可靠性和实时性进行了研究工作.通过设计了自主式CAN总线PC控制卡及相应软件,很大程度上减小了PC死机对整个系统的影响,提高了PC控制的可靠
元数据是一种数据组织技术,它描述的对象是资源的描述信息。经过元数据的组织,能实现数字化信息的结构化存储、有序化组织和高效准确的检索;支持元数据的多个资源系统,能够以机器
该课题主要探讨的内容就是基于现场总线LonWorks技术的各种智能节点硬件、软件及智能网络适配器硬件和虚拟设备驱动程序VXD的设计、开发以及应用.智能节点包括热电阻、热点偶