基于缺失特征的文本无关说话人识别鲁棒性研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:yiwangcom
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着说话人身份识别研究的深入,提高实用环境下文本无关说话人识别系统性能鲁棒性已成为当前研究的重点。以高斯混合模型(Gaussian Mixture Model,GMM)为代表的概率统计模型由于可以有效的描述语音特征参数数据集分布,成为文本无关说话人识别领域的主流技术,但基于概率统计模型的说话人识别系统的性能有赖于语音参数数据集,尤其是训练与测试特征数据集的匹配程度。然而,实用环境下由于背景噪声的不同影响、传输通道的多样性,使得测试特征数据集与训练集失配,而导致了系统性能的下降。本文主要研究减少测试特征集与训练特征集间的失配程度以提高系统性能鲁棒性的方法,根据环境对语音中不同时频段污染程度不同,以及语音信号本身的冗余性,深入研究语音特征参数中受污染严重的缺失特征的筛选和重建方法。主要研究内容如下:1.给出了一种基于谱减法语音增强的说话人识别方法,采用改进的谱减法,直接由增强后的语音功率谱提取MFCC参数。在不同信噪比的白噪声和F16战斗机噪声环境的实验表明,谱减法可以在一定程度上提高噪声环境下系统的识别性能。分析并指出了语音增强方法很难得到信号在受噪声污染严重的频段的准确估计,这是限制语音增强方法进一步提高系统鲁棒性的重要原因。2.根据噪声对语音中不同时频段的影响程度不同,及语音信号本身含有很多冗余信息,给出了一种基于子带信噪比阈值的缺失特征边缘化说话人识别方法,利用子带信噪比将Mel子带特征的各维分量分为可靠特征与缺失特征,只用可靠特征对话者模型计算边缘化输出概率评分。由于将受污染严重的缺失特征丢弃,使系统噪声鲁棒性得到较大提高。在此基础上,又给出了一种基于谱减和缺失特征边缘化相结合的说话人识别方法,使系统性能得到进一步提高。3.给出了基于Mel子带相关性进行缺失特征重建的方法,根据同一个语音特征类的协方差关系,由说话人可靠特征进行缺失特征重建。提出了两种基于统计分布模型的特征重建方法:基于聚类单高斯模型的缺失特征重建和基于GMM模型的缺失特征重建方法,前一个方法是先聚类,再对子集特征进行高斯分布描述,而后一种方法则将两者合并一起做,从而能更精细地描述出整个特征集的统计分布,以及各个分布间的关系。实验表明,与缺失特征边缘化方法相比,缺失特征重建方法进一步提高了说话人识别系统在噪声环境下的性能。4.分析发现了基音频率会影响MFCC参数对声道特性的准确描述,进而影响说话人识别系统的性能;由此提出了一种基于平滑幅度谱的SMFCC参数(Smoothing MFCC),实验表明,SMFCC参数性能在整体上优于MFCC参数,在女性说话人数据集上识别性能提高尤其明显,并且具有更好的时间鲁棒性。
其他文献
期刊
在阵列信号处理领域,基于麦克风阵列的声源定位技术是一项研究热点,其在军事和民用等领域都得到了广泛应用。在实际应用中,由于存在环境噪声和混响干扰,尤其是在室内环境中(
创新型国家战略的提出,对创新人才培养形成了新的挑战,而德育与创新人才的培养息息相关。为培养大量创新型人才,实现2020年把我国建设成为创新型国家的战略目标,学校需要从创
本文从超高层办公楼中央空调的方案设计出发,通过对比分析三个方案的冷热源系统、末端及输配系统、运行调节管理、能源计量收费及初投资和运行费用等,详细阐述了该项目空调的
<正>此次日本国内抗议新安保法案运动的显著特点是,它不仅具有广泛的群众性和广阔的地域性,还有日本国内政治高层及社会上层的普遍参与。日本是个战败后重生的国家,由于其战
植被仿真研究一直以来都是虚拟现实和计算机仿真研究领域中的一个重要课题,植被种类繁多,外部形态结构丰富多样,生长过程复杂。无论是计算机动画、大型游戏,还是虚拟交通仿真
随着二胎政策的全面放开,对于女性就业性别歧视现象更加的普遍,在未来符合生育条件的职场女性可能要休两次产假。曾经是职场"香饽饽"的已婚女性的就业面临着新一轮的挑战,无
牙龈出血是口腔最常见的疾病之一,一般当牙龈出血时,人们往往认为是可能是用力过猛,或刷牙姿势不正确或是维生素C的缺乏导致的,只是小病,有些患者去医院就诊,医务人员也只是
<正> 牙龈出血是常见现象,遇到牙龈出血时,人们常易想到是维生素C缺乏或是血液病引起,因此,医务人员常给患者大量维生素C口服,而患者的症状往往并不见好转。那么,究竟什么原
<正>中学生的“疑似早恋”,在这里指的是一些中学生在同异性交往的过程中过于密切,因而引起教师和同学的怀疑或非议,并被判断为早恋的行为。通常情况下,教师及其他同学会对这