噪声环境下鲁棒性说话人识别算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户：danble

【摘要】

：

语音信号可以传递出有关于说话人的多种信息,如语言信息(说话的内容),说话者信息(身份,情感,生理特征等),环境信息(背景,信道等)等。说话人识别是指,通过从说话人提供的语音

【作者】

：

崔锐

【出处】

：

西安电子科技大学

【发表日期】

：

2004年期

【关键词】

：

鲁棒性说话人识别噪声语音增强缺失特征 PMC算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语音信号可以传递出有关于说话人的多种信息,如语言信息(说话的内容),说话者信息(身份,情感,生理特征等),环境信息(背景,信道等)等。说话人识别是指,通过从说话人提供的语音信号中提取出中能反映其身份特征的矢量序列来识别说话人的技术。近年来,说话人识别的性能在实验室环境下已经相当高,但在实际应用中,由于背景噪声和信道畸变等影响会导致其识别率大大下降。为了将说话人识别技术推广到实际应用环境中,解决噪声问题对系统识别率的影响,本文在梅尔频率倒谱(MFCC)特征提取和矢量量化(VQ)建模的基础上,设计了噪声环境下的鲁棒性说话人识别系统,并分别从系统的特征空间和模型空间两个方面切入,对实际环境中的抗噪声鲁棒性算法做了深入的研究。现有的许多单一抗噪技术,如信号空间的语音增强算法、特征空间的特征调整算法、模型空间的噪声补偿算法等,都需要先根据信噪比估计环境噪声,然后再对特定噪声做去噪或补偿处理。当环境中噪声已知或只存在平稳噪声时,这类方法能够达到不错的降噪效果,比如基于电话信道的说话人识别系统。但当说话人识别技术应用到更复杂的环境中时,噪声往往是未知的,且会随着时间的变化而发生变化,这就会导致系统识别率严重下降。为了解决这个问题,本文研究了两种抗噪声算法,针对环境噪声引起的信号特征被破坏和训练与识别环境失配的问题给出了解决方案。首先,在特征空间研究了一种基于语音增强和特征缺失结合的鲁棒性算法,通过从增强信号中获得的重要信息自动生成缺失的特征掩模,用于检测可靠的说话人特征。其中,为了增强输入的说话人语音信号,并进一步为计算缺失特征掩模提供有用的信息,本文采用最佳修改的对数频谱幅度(OM-LSA)语音估计与最小控制递归平均(MCRA)噪声估计结合的鲁棒性增强算法。MCRA估计噪声功率谱可以做到计算有效且偏差较小,因此对于低输入信噪比和存在潜在加性噪声的情况是鲁棒的,其最大的优点在于能够快速跟踪噪声谱中的突变。OM-LSA估计器也表现出良好的噪声抑制特性,去除噪声的同时仍然保留了弱语音分量。此外,为了解决噪声引起的训练与识别环境失配的问题,在模型空间引入了并行模型合并(PMC)算法,通过在识别阶段将估计的加性噪声和卷积噪声叠加到纯净语音训练的说话人模型上的方法,达到解决上述问题的目的。本文在白噪声和Babble噪声环境下,对说话人识别系统中所采用的鲁棒性算法分别进行测试得到结果:(1)将OM-LSA与MCRA结合的增强算法与仅用OM-LSA处理带噪语音相比,其PESQ值平均分别提高了0.335和0.419;(2)增强和特征缺失结合的算法在低信噪比和非平稳噪声环境下表现优越;(3)模型空间引入了PMC算法后,在30dB输入信噪比的情况下系统可以实现100%的识别率,其中PMC算法对系统识别率贡献了10.9%的正确率。

其他文献

基于手机APP的大学生心理健康教育实效性研究

目前网络已渗入到各个领域,对人们的生活产生了不可估量的作用。据有关数据统计,截至2015年12月,中国网民数量已达6.32亿,同时使用手机上网频率达83.4%,第一次超越电脑上网使

学位

心理健康心理健康教育网络手机APP

印度灵活就业人员的社会保障

<正>由法律赋予贫困人口工作的权利具有重要意义,它将有助于缓解财富和收入分配过程中的巨大落差,值得发展中国家仿效。印度既是发展中国家,又是人口大国,且灵活就业人员占就

期刊

灵活就业人员非正规部门

浅谈中专会计教育中的职业道德教育

<正>会计职业道德教育是指对会计人员和潜在会计人员进行有目的、有计划、有组织的道德教育活动。会计职业道德教育是提高会计职业道德水平的一种重要方式和主要途径。会计职

期刊

会计教育职业道德教育会计职业道德

层级护理模式在呼吸消化科病区管理中的应用

目的我们针对消化病区管理的过程中应用层级护理的效果进行。方法针对2016年的九月份到十月份进入我们医院接受治疗,并患有呼吸消化疾病的患者,选择层级护理这种模式,能够提

期刊

层级护理消化内科比较分析

大风量空调机组应用于小空间的策略研究

将大风量空调机组应用于小空间场所时,存在各房间空调使用要求不同、风量分配不均匀、各房间空调冷热负荷差异性大、设备如何利用以及建筑能耗高等问题。以杭州市某科技服务

期刊

大风量空调机组小空间场所变频技术定风量风阀降低能耗

会计的职业道德

会计行业作为市场经济活动的一个重要领域,主要提供会计信息或鉴证服务,其服务质量的好坏直接影响着经营者、投资人和社会公众的利益,进而影响着整个社会的经济秩序。会计工

期刊

会计职业道德会计人员会计职业

大学生对同龄人称谓语的语言变异调查分析——以西北民族大学为例

随着社会经济和科学技术的发展,出现了越来越多的语言变异现象,其中称谓语就存在着十分显著的词汇变异现象。基于对西北民族大学学生调查分析,进行语言变异探究,有利于我们把

期刊

语言变异称谓语面称

Web图片上传技术的探究

制作动态网站时经常要向服务器上传图片,上传的方式共有三种,服务器存贮图片的方式共有两种,应根据实际情况选择图片上传技术,扬长避短。结合动态网站制作实例,对图片上传的

期刊

ASP图片上传组件二进制

临床护理路径对良性前列腺增生并腹股沟疝临床疗效并发症及预后的影响

良性的前列腺增生(BPH)疾病属于临床常见疾病,患者发病后存在前列腺相关肿大,腹内压上升,形成排尿功能相关障碍,且病情进展可发生腹股沟疝等并发症[1,2]。良性的前列腺增生并

期刊

临床护理路径BPH前列腺增生临床护理路径干预

仿人型残疾人假手机构的研究

采用欠驱动原理和耦合原理研制了具有感知功能的集成化多自由度的假手,该手尺寸与成年人手相仿,具有抓握物体自适应能力,能够完成力量抓握和精确抓握.采用数学建模的方法设计

期刊

欠驱动耦合假手

噪声环境下鲁棒性说话人识别算法研究

与本文相关的学术论文