基于人脸和语音深度特征融合的说话人识别与标注算法研究

来源 :华侨大学 | 被引量 : 0次 | 上传用户:happy_hoo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人鉴定在众多实际安全领域有重要应用,然而基于单一模态生物特征的鉴定模型易受环境因素变化的影响。通常较单一模态,多模态特征融合方法可以提供更丰富和更全面的本质信息,并且近年来得到了越来越多的关注。因此,有效的多模态特征融合方法发展对这些安全应用领域具有重要的实际意义.本文首先阐述有效的语音人脸特征融合的说话人识别方法,其中融合方法基于多模态特征融合的神经网络实现。人脸特征通过卷积神经网络提取得到,语音特征则通过手工提取的高层语义特征,以此实现人脸特征与语音特征之间的兼容,同时整个过程端到端实现,可以达到自动学习特征融合映射关系。本文针对不同人脸语音特征融合的网络作出不同层次的融合方式的比较,进而得出不同层次融合对最终识别性能的影响。最终的实验结果表明多模态特征融合的方法较单模型方法性能更为高效,通过对比不同层次的特征融合方法,发现特征层融合方法较决策层融合方法更为有效。其次阐述了基于人脸语音特征融合的方法,本文进一步提出了基于注意力机制的人脸语音特征融合的说话人标注算法。首先通过VGG-face得到对应的人脸特征以及语音的MFCCs,作为后续网络输入,后本文针对语音特征的编码提出两种不同的编码模块,以获得判别能力较强的语音特征。此外,对于人脸与语音特征局部关系的挖掘,提出了基于注意力机制的局部特征融合方法,通过注意力机制得到局部特征之间关系的注意力权重,后通过对人脸语音特征做加权和,得到融合特征。进一步,为了充分融合特征,对局部人脸与语音特征进行全局融合,提出基于双线性池化的融合方法得到最终给的融合特征,用于最后的说话人标注。通过实验对比发现本文的方法较以往工作更为鲁棒,性能更强。
其他文献
雷达属于主动传感器,通过收到的雷达回波对目标进行识别。其探测距离较远且精度高,具有全天候、全天时的作战优点;但是,雷达面临着反辐射导弹、电磁干扰等威胁。红外传感器属
随着无人驾驶技术的不断发展和进步,无人驾驶履带车辆逐渐成为世界各国履带车辆发展的重点之一。由于履带车辆的转向机构种类和传动方式较多,对于无人履带车辆的横、纵向运动
随着滚动轴承转速的提高,轴承环间高速气流对轴承腔内油液的润滑有着重要的影响。轴承高速运转过程中,润滑油在高速旋转气流和离心力等的作用下产生雾化。轴承腔内润滑油的雾化将会影响轴承的润滑效果,同时也会影响轴承的冷却。因此本课题针对高速滚动轴承环间润滑油入射过程液滴的变化规律以及雾化机理展开了研究。本课题所研究的对象为高速角接触球轴承,在轴承外圈内壁开设沟槽的基础之上,通过对轴承滚动体复杂边界条件进行网
随着社交媒体的快速发展,信息呈现爆炸式增长,从海量的信息中挖掘有价值的内容具有十分重要的现实意义。本文围绕微博话题发现技术和实体关系抽取技术展开研究,提出基于改进
背景:心肌肥大和纤维化可以参与多种心血管疾病的发展过程。然而持续的存在会引起心脏结构的改变,影响心脏功能,最终导致心力衰竭的发生。莫诺苷(Morroniside,Mor)是山茱萸中的一种环烯醚萜苷。已经有研究表明,莫诺苷不仅可以预防大鼠的脑缺血/再灌注损伤,而且还可以预防大鼠的急性心肌梗塞。而有关于莫诺苷对心肌肥大的影响,目前尚未见报道。研究目的:本研究的目的就是使用血管紧张素Ⅱ(angioten
整体上市是一种传统且具有中国特色的上市方式。由于我国的证券交易市场还处在发展的早期阶段,证券市场的发展就还不够成熟、不够稳定。所以当时受证券交易市场政策的影响,许多的企业集团只能选择通过分拆股份进行上市,分拆上市在当时特定的证券市场历史发展时期虽然起到了一定的意义和作用,但也因为其中存在一些的弊端,如公司的内幕交易、中小股东和上市公司债权人的根本利益关系严重受损,同业之间的竞争等一系列的问题,这些
B2C电子商务发展迅速,成为网络零售的领头羊。B2C电子商务主要的特点之一是较高的订单履行时效,这给消费者带来优质的购物体验的同时,也给B2C电子商务仓库的订单处理带来压力。订单成组拣选可以提高订单的拣选效率,但需要额外的订单合并过程将订单进行还原。B2C电子商务仓库大多采用“先拣后合”的订单成组拣选策略,在这种策略下,成组的订单依次经过订单拣选过程、中间缓存区域和后续的订单合并过程。由于订单组之
本研究是一项教育现象学研究,旨在通过“还原”来解释有关大学师生交往的理解性知识。本研究将大学师生交往置于变化的情境和动态的过程中,以学生的前概念、前反思的体验为研究材料,以“诗化”的语言描述体验,带着“偏见”、“主见”、“前见”诠释体验,让大学师生交往的意义逐步显现,发现大学师生交往另一种可能的存在方式。学生在大学师生交往中的体验故事,以“圆”、“在与不在”、“人物品藻”三部分呈现。学生在师生交往
弱刚度回转体零件广泛应用于特种车辆、航空航天、船舶动力等领域。因其结构特殊性,在切削加工及热处理过程中均易产生较大的变形,严重影响零件的精度。同时,在切削加工过程
目前,脑机接口在康复医疗、生物医学、娱乐等领域具有很好的发展前景,脑控移动机器人系统就是一个重要的研究领域。基于脑机接口的移动机器人研究具有重要的科学意义和应用价