复杂背景下说话人确认的研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:zhang19890922
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
复杂背景下的说话人确认是指,在语音信号背景比较复杂的情况下,对说话人身份的确认工作。复杂背景包括,除了说话人语音以外,其他的背景音乐、噪声以及各种杂质音质。因此,复杂背景下的说话人确认要包括两大方面的工作,一方面是语音信号分离;另一方面是对已经通过分离算法得到的纯净的语音信号进行身份确认。当前的语音信号分离,主要采取两种方法,一种是听觉场景分析(ASA),另一种是盲源分离(BSS)。盲源分离方法是对混合后的信号进行操作,从而提取出其中的独立分量,因而此算法也称为独立分量分析(ICA)。ICA有很多的分支方法,其中一种方法在信号分离领域得到广泛应用,这种方法的分离效果较好,同时也因为它的快速收敛特性,被称为固定点FastICA。本文在FastICA算法的原理基础之上,引入了基于MCMC的贝叶斯估计,改善了针对非稀疏源信号的分离情况,提高了FastICA的语音分离效果。在说话人确认模型的选取方面,因为本文分析的对象是与文本无关的说话人确认,故而采用一种对传统GMM模型的一种改进方式:高斯混合模型-全局背景模型(GMM-UBM),这个模型可以通过对大量的语音信号进行训练,得到用来描述特征分布的高阶GMM,这也是此模型的一大优点。针对模型的鲁棒性能改进,论文釆用Feature Mapping和MAP两种信道补偿的方法,都取得了很好的效果。最后,基于以上各种方法,采用工具Visual Studio2010和Matlab2014a,完成论文介绍的复杂背景下说话人确认系统的研究工作。同时,详细介绍了所采用的全部算法和复杂背景下的说话人确认实现的相关步骤,并且阐述了研究成果以及接下来需要考虑和分析的问题。
其他文献
CDM-FH-OFDMA是结合了CDM与FH-OFDMA的一种多址方式,不仅具有OFDM技术抗多径干扰、频谱利用率高的特点,而且也具有CDM技术抗干扰性好、抗多径衰落、保密安全性高的特点。该系统
学位
摘要:随着我国经济建设的不断提高,人们的生活和审美发生了巨大变化。一个高品质的生活离不开一个良好的环境。优良的绿化环境能够带给人们愉悦的心情,提高环境指数,更可以丰富我们的大脑并充实我们的精神生活。自21世纪以来,园林绿化开始显得尤为重要,政府每年都要大量投资园林绿化改造工程,自此园林科学开始为我国环境保护建设谱写新的篇章,进入到一个崭新的发展阶段。本文结合自己的实践经验及大量的阅读知识,对园林工
期刊
非二进制低密度奇偶校验码(NB-QC-LDPC)与二进制码相比可以达到更好的纠错性能,但是会造成译码复杂度的增加。这是由于更新校验节点信息时的高复杂度以及高内存空间需求所造
近年来陋若3D电影的热映,三维立体视频成为工业界和学术界的热议话题.它可以广泛应用在三维立体电视、视频会议、视频远程监控、教育、医疗和军事等诸多领域,极大地丰富了现
本文的设计采用FPGA来实现π/4DQPSK调制解调。采用π/4DQPSK的调制解调方式是基于频带利用率、误比特率(即抗噪性)和实现复杂性等综合因素的考虑;采用FPGA进行实现是考虑到高
运动目标检测与跟踪技术是计算机视觉研究的热点之一,涉及模式识别与人工智能等多方面的技术。在视频监控、导弹跟踪、人体运动检测、智能交通系统等多个领域,运动目标检测与跟
ASON(AutomaticallySwitchedOpticalNetwork,自动交换光网络)是指在选路和信令控制之下完成自动交换功能的新一代光网络。它是一种标准化的智能光传送网,被广泛地认为是下一代
随着无线通信系统的发展,人们对更高的数据传输速率、更大的系统容量等提出了一系列的要求。多天线发射多天线接收(MIMO)和正交频分多址(OFDM)技术的相结合成为了当今Wimax网
隐写和隐写分析是信息隐藏领域的重要课题,已经受到各国政府、军方、情报部门和各种研究机构的重视。隐写和隐写分析是守和攻的关系,是相互推动、共同发展的矛盾体。一方面,隐写