基于表示学习的说话人识别研究

来源 :内蒙古大学 | 被引量 : 0次 | 上传用户:xiaoshancx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别是一种非接触式的生物特征识别技术。近年来,随着深度学习的发展,以及智能手机、智能音箱、智能家电的普及,与之相伴的说话人识别技术得到了大规模的应用。然而,在实际的应用场景中,说话人识别系统依然面临诸多挑战,说话人发声的变化性和所处的场景、环境的变化性等不确定性因素制约着系统的性能。为此,本文基于深度神经网络的表示学习方法,研究从复杂的语音信号中提取具有鲁棒性和区分性的说话人表示,并能够灵活实用地应用在说话人相关的不同下游任务中,以提升系统的性能表现。本文的贡献有以下几个方面:一、提出了基于密集连接卷积-双向注意力深度神经网络的说话人表示学习方法。结合密集连接卷积神经网络的特征复用机制,提取深层特征用来表示帧级别说话人信息,提出将双向序列建模与注意力机制有效结合的双向注意力池化方法。该方法提升了深度神经网络对说话人特征的学习能力。在多个下游任务中,验证了所提出模型能够提取出具有区分性和泛化能力的说话人表示。二、提出了基于注意力机制优化的说话人表示学习方法。考虑到注意力机制在提取说话人表示时,更关注相对重要帧信息的特性。我们结合注意力机制,改进优化了用于池化方法的全局多头注意力机制和多分辨率多头注意力机制,并从定性和定量的角度进行了分析。结果表明,所提出的优化机制能够从不同视角有效地捕捉语音特征中的说话人信息,提升说话人表示的区分性。三、提出了基于说话人损失优化的语音增强方案。考虑到现有说话人表示的建模方法存在泛化性能弱、鲁棒性差等问题。我们分别从数据和模型两个方面,分析了现有说话人表示鲁棒性建模方法存在的问题及缺陷。从多个角度设计优化方案,提出了一种有效的数据增广策略来训练鲁棒性说话人模型。并结合语音增强模型,进一步提出了基于说话人损失优化的语音增强方案,提升了说话人表示在噪声环境下的鲁棒性。
其他文献
消防工程在建筑工程中具有重要地位,其与建筑安全性具有直接关系。若消防工程质量较低,必将对建筑防火性能产生影响,从而对群众生命财产安全构成威胁。因此为避免该种现象发生,通过实际调查及分析文献资料,对新型化学防火材料进行分析,并重点对其在消防工程中的应用进行研究,以期可以为施工人员进行施工作业提供依据。
介孔材料因其大比表面积、规则的孔道结构和对金属的高分散性等独特的性能在诸多领域应用潜力巨大,尤其是可能被作为载体应用到催化领域之中。一氧化碳优先氧化(PROX)是净化燃料电池的富氢气中一氧化碳有效方法,而催化剂是其技术的核心。本论文主要目的在于改进催化剂的制备方法,探索适合于CO优先氧化的催化剂制备新方法。本工作采用MCM-41介孔材料和介孔CeO2为载体制备Co3O4-CeO2/MCM-41催化
学位
拂去历史的尘埃,轻叩文化的大门,你——一位中国文人,完成了自己最大的心愿,创造了一连串连探险家都很难做到的奇迹,一路向西,直到两河流域。那里有什么?有不堪入目的破败落后,有苦难中呻吟的人们,还有黑乎乎的随时可以带走你生命的枪口在随时可能丧命的危险中,在狭窄的吉普车厢内,在颠簸的土路上,你用笔记录下了每一
新时期小学数学教学改革中,应当使数学内容合理融入学生实际生活当中,并在核心素养教育背景下推动小学数学教学实践探索创新。为提升小学低年级小学生两步计算解决问题的能力,教师可采用潜移默化的训练、实际生活问题驱动等策略,逐渐实现预期教育改革育人目标。进行数学计算教学时,
采用51系列单片机STC89C52作为控制核心,以三轮轮式结构作为小车的机械平台,结合多种传感器、程序设计以及APP软件,实现了具有自主避障功能、黑线寻迹功能、自动大灯开启功能的遥控智能小车。避障子程序中有效结合了红外避障和超声波避障的优点,达到了一个比较理想的避障效果;寻迹子程序中提出了后退再判断的方法,有效解决了轨迹布置误差导致小车偏离轨道的问题。经实际测试,该
低维温差电材料在温差制冷和温差发电方面展现的广阔应用前景引起了科学界的普遍关注。本论文采用电化学沉积方法,以制备高性能的Bi2-xSbxTe3温差电材料为目的,对含有Bi3+、HTeO2+和SbO+的单组分溶液体系及Bi-Sb-Te三元溶液体系的电沉积过程进行了研究。在此基础上,研究了Bi2-xSbxTe3薄膜的制备工艺,通过SEM、XRD、EDS等现代物理测试技术对其形貌、结构、组成及性能进行了
目的调查房颤患者行射频消融术后负性心理与心理弹性的现状;探讨房颤患者行射频消融术后焦虑、疾病不确定感与心理弹性的相关性;了解心理弹性在焦虑和疾病不确定感之间的中介效应;为护理人员通过调节患者的心理弹性,改善房颤患者射频消融术后的负性心理,提高患者的心理健康水平提供理论参考。方法采用便利抽样法于2019年12月至2020年7月,选取大连市某三级甲等医院心律失常科收治的
导师花宝金教授长期从事中西医结合肿瘤的临床与基础研究。认为正气内虚是肿瘤发生的根本,癌毒是肿瘤发生的必要条件。收集导师多年临床组方,归纳、总结后发现清热解毒或攻毒散结之法常贯穿于始终。结合现代药物理论及导师多年临床经验,总结出临床常用七组抗癌解毒药对:(1)夏枯草、半枝莲;(2)石见穿、猫爪草;(3)金荞麦、蒲公英;(4)龙葵、白英、白花蛇舌草;(5)山慈菇、浙贝母
契约科学和社会治理的理论在我国医疗保障领域逐渐得到发展应用。目前我国医保政策强调复合型付费,本文基于均值定价、激励相融、剩余控制权三个理论,构建契约科学理论框架,解释医保复合型付费约束-引导-激励机制的作用机理、逻辑关系和预期结果,并以金华市医保支付制度改革为例进行验证。在此基础上,提出完善医保约束-引导-激励机制的建议。
随着我国铁路快速发展,站场改造、设备更换、新建站房等铁路更新改造工程的项目数量与投入资金逐年增多,由此产生的施工安全风险与日俱增。施工中大量的安全隐患,极易影响列车运行,给施工人员及广大旅客生命安全带来极大的威胁。本文参考现有安全风险管理方面文献,对铁路安全风险管理理论进行阐述,分析X局安全风险管理现状及存在不足,以Y站站场改造工程为案例,利用“头脑风暴法”进行风险