话者识别中失配信息补偿理论和方法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:guoshun9231
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在文本无关的话者识别中,尤其以NIST话者测评为代表的复杂环境下电话手机语音的话者识别,训练语音与测试语音的失配是导致识别系统性能下降的重要因素。这种失配包含语音类失配和外部干扰失配两种:包括训练和测试文本内容不同的影响,周围环境噪声的影响,语音信号采集设备(话筒)的影响,传输调制信道的影响等。除此之外,还有说话人自身因素的影响,情绪变化等。如何对这些失配信息进行准确而有效的补偿是当前话者识别研究领域的热点问题。论文针对复杂环境下电话手机语音识别系统的失配问题,围绕如何解决当前失配方法的不足,更加有效的对上述两种失配进行补偿,如何提高训练和测试失配补偿的速度,如何将失配补偿与区分性系统结合起来等方面进行了深入的研究。论文首先深入分析了现有的一些失配补偿方法的思路和算法实现细节。针对语音类失配问题,从训练和测试两个角度详细分析了在GMM-UBM框架下UBM模型在话者模型训练和评分测试中所起到的重要的基准作用,以及通过测验语音与目标话者模型和UBM模型的评分相减来解决语音类失配的问题。针对外部影响失配问题,详细介绍了现有的一些基于特征域、模型域、评分域的失配补偿方法,并分析了这些失配补偿方法的不足之处,主要体现在需要信道分类器对语音进行信道判决,只能针对孤立的信道类别进行补偿,以及信道分类器判决可能出现误判,训练信道分类器也需要相应的信道标记的语音。这都限制了当前已有的一些失配补偿方法的效果。论文针对语音类和外部干扰两类失配问题和现有失配补偿方法存在的不足之处,将因子分析方法用于估计说话人确认中训练和测试受到的失配影响,详细分析了在基于因子分析的失配补偿方法中,如何构建失配信息空间和话者信息空间,并通过这两个信息空间估计语音所受到的失配影响大小(对应为失配因子),其失配补偿是按照实际的失配影响大小而不是通道类别进行补偿,无需利用信道模型判决语音的信道种类,避免信道种类判决错误的影响。故其连续相对的补偿效果要优于传统的失配补偿方法。在NIST SRE 2008测评中我们将本方法应用于长语音任务中,在50多家国际参赛机构中排名第一。论文还利用话者信息空间解决短语音利用MAP方法据估计话者模型的不足问题,实验结果效果明显,相对提高17%左右。为了提高语音在失配补偿时的速度,论文提出了一种基于CUBM选择模型和因子分析的快速失配补偿方法。CUBM由UBM高斯分量通过KL距离准则和自底向上的分层聚类得到的高斯混合模型。在失配补偿时,利用CUBM选择模型为每帧语音特征矢量选择一组相应的UBM高斯分量,只用这些高斯分量计算相应的EM统计量,可以显著降低失配补偿的计算量。论文还提出了一种基于Top-N的选择策略,以提高UBM高斯分量的选择精度,平衡系统性能和失配补偿计算量之间的矛盾。在NIST SRE 2006主任务上的实验表明,基于CUBM选择模型的快速失配补偿方法在取得和原始失配补偿方法相近的系统性能的同时,计算量降为原来的八分之一左右,解决了失配补偿方法应用中的计算量问题。论文提出将失配补偿和SVM区分性话者识别系统结合起来的一种方法。当SVM输入是GMM均值超矢量时,SVM的训练样本(目标和冒认话者的GMM均值超矢量)在模型域进行补偿,测试时,测试语音也同样提取相应的GMM均值超矢量,在模型域补偿后与SVM话者模型测试。在NIST SRE 2008核心任务的实验表明,失配补偿后的SVM系统性能比补偿后的GMM系统性能有7%左右的提高,比补偿前的SVM系统性能相对提高24%。实验结果充分说明了失配补偿方法对区分性话者识别系统性能提升的重要意义。论文的研究工作得到了国家留学基金委2009年度国家公派高水平研究生项目(No.2009634072)和中国科学技术大学研究生创新基金(No.KD2008056)的资助。
其他文献
现如今,对公路工程而言路基十分关键,其质量会直接关系到整个公路工程的安全与质量。在公路工程进行施工的阶段,要严格依照相应的要求来进行施工材料的质量控制工作。在正式
我国体育产业的发展受诸多因素影响,其中起关键作用是当前我国的宏观经济形势,然伴随着2008年北京奥运会成功申办,关于对体育产业的政策判断,市场开始习惯的加入奥运因素,甚
高分辨率、高比特精度、高保真色彩的视频需求带来了视频图象的数据量急剧增大,进一步提高压缩效率是视频编码的迫切需要。提高视频压缩效率的同时,编解码器的硬件复杂度,访
公元前2年(哀帝元寿二年),25岁的哀帝突然去世。此前他的祖母傅太后与母亲丁皇后都已去世。王政君又成为最高权威,她立即恢复王莽的大司马职务。王莽复职第一件事是罢免董贤,
目的总结恶性原发性腹膜后肿瘤(PRPT)临床治疗经验,分析影响术后效果的因素。方法回顾性分析解放军总医院1999-2008年收治的249例恶性PRPT的临床资料。结果 249例共手术302例次
凭借着创新精神、合作意识和奉献精神,“天剑”团队克服重重困难,取得累累硕果,在近期由中国航天科工集团公司举办的2016“航天科工年度感动人物”评选中,成功入围十大候选人。  创新——永不止息  对于“天剑”突防团队来说,技术创新就是生命。只有不断推动传统技术转型升级,才能强化技术引领,实现产业发展弯道超车。  正是秉持这一创新理念,天剑团队一方面进行技术攻关,在传统光电技术基础上引入新技术,通过技
易卜生是在我国现代文学史上发生过巨大影响的一位作家,与“新文化运动”有着一种“非同等闲的关系”。①他的社会问题剧在我国家喻户晓,对“五四”时期的思想启蒙和民主运动
妊娠期糖尿病(gestational diabetes mellitus,GDM)是指在妊娠期间首次发生或发现的糖代谢异常,包括一部分妊娠前已患有糖尿病但未曾获得诊断和仅在此次孕期被发现的糖尿病患者。
目的回顾分析本院从2002年6月至2008年10月对387例,408侧(Ⅰ型32侧,Ⅱ型108侧,Ⅲ型211侧,Ⅳ型57侧)腹股沟疝行无张力修补术治疗的经验和效果。方法201侧疝行PlugMesh修补术.207侧疝
作为盛唐时期集绘画、音乐、诗歌才能于一身的著名诗人,信仰是王维生命中的支点。它贯穿在王维生活中的各个阶段,生活细节的点点滴滴,更散发于宛若天籁般的诗歌当中。本文首