【摘 要】
:
生物特征识别技术,指的是利用计算机对人体的生理特征或者行为特征进行个人身份识别认证的技术。随着计算机的计算能力不断提高和互联网的普及,生物特征识别技术在近些年得到了飞速的发展,并且已经广泛应用于社会生活之中。其中人脸识别技术和声纹识别技术是应用较为广泛的两种单模态生物特征识别技术。随着深度学习技术的飞速发展,在单模态生物特征识别技术得到广泛应用的同时,出于扩展应用场景的需要,对多模态生物特征识别技
论文部分内容阅读
生物特征识别技术,指的是利用计算机对人体的生理特征或者行为特征进行个人身份识别认证的技术。随着计算机的计算能力不断提高和互联网的普及,生物特征识别技术在近些年得到了飞速的发展,并且已经广泛应用于社会生活之中。其中人脸识别技术和声纹识别技术是应用较为广泛的两种单模态生物特征识别技术。随着深度学习技术的飞速发展,在单模态生物特征识别技术得到广泛应用的同时,出于扩展应用场景的需要,对多模态生物特征识别技术的研究也日渐增多。因此本文主要研究了基于深度学习的身份认证算法,包括人脸识别、声纹识别以及多模态说话人识别。本文的主要工作如下:首先,针对人脸识别数据库的长尾分布问题,提出了改进的损失函数最小边际损失以优化类间距离,增强深度特征的判别能力。通过在深度学习网络中添加不同的损失函数组合,在多个人脸数据集上进行了对比实验。最终实验结果表明改进后的损失函数提升了人脸识别的能力,减少了数据长尾分布带来的负面影响,同时为后续的多模态识别实验打下了基础。其次,出于多模态融合实验中音频特征提取的需要,对声纹识别算法和音频提取算法进行了研究,提出了两种音频编码算法。对声纹特征参数主要是梅尔倒谱系数的提取方法进行了分析,在外文语音数据集Vox Celeb上,分别进行了声纹识别实验以及无监督分类实验,通过与传统方法进行比较,验证了深度学习提取音频特征的能力,为后续多模态识别实验中提取音频特征的部分打下了基础。最后,针对只利用单一模态时,在视频中进行说话人识别易受视频质量和说话人活动影响的问题,研究了结合人脸和语音两种模态进行多模态识别的方法。对于人脸和语音两种模态的特征融合,使用了分解双线性融合方法以提高特征融合的效果。提出了一种基于注意力机制的端到端网络模型,以保留人脸和音频的语义一致性,使得模型能够更好的关注人脸的关键点。最后将分解双线性融合方法以及基于注意力机制的端到端网络模型在BBT和Friends数据集上进行了对比实验,实验结果表明本文所提出的方法能够更有效地融合人脸和音频信息,并且有利于更好地提取多模态的关键特征以提高识别准确率。
其他文献
自动情感识别技术在各种智能系统中的应用具有很大潜力,包括智慧教育、在线游戏、智慧医疗等。由于深度学习方法的出现,自动情感识别技术经历了由基于手工浅层特征的传统识别方法发展为基于深度神经网络算法,由基于单一模态的分类器发展为基于多模态聚合的情感识别的过程。其中最常使用的模态是通过视频数据获取的语音-视觉双模态,目前关于语音-视觉情感识别的大多数文献由于从这两个模态提取特征的方法和多模态聚合的方法存在
汽车漆面不仅仅作为汽车零部件的保护层,其美观程度往往决定了用户在购买时的第一印象。目前,汽车漆面表面缺陷检测主要以人工检测手段为主,该方法效率低、稳定性差,且受人为主观因素影响较大,严重影响了产品质量。近年来,机器视觉的快速发展使得很多表面质量检测中的难检、误检、漏检等问题得到了解决。针对目前汽车漆面检测存在的检测效率低、系统复杂、稳定性差等问题,本文以汽车引擎盖表面作为研究对象,将机器视觉技术与
多波束天线能够以较窄的波束、较高的增益覆盖较大的空间区域,且能够根据需要灵活调整波束工作状态,在卫星通信、雷达探测等方面得到广泛应用。比特编码阵列天线是近年来出现的一种新型多波束天线,受到天线学界的大量关注。它将有源器件加载在天线单元上,通过控制其偏置电压,对天线单元的辐射相位进行量化调节,从而实现阵列的多波束辐射功能。相比于传统的相控阵技术,比特编码多波束技术结构简单、成本低廉,有利于商业化的大
本文设计了一款基于CMOS工艺的宽带射频功率放大器,包含驱动级放大器及级间匹配网络、功率级放大器及输出匹配网络。更宽的带宽、更好的效率和低成本是移动无线通信系统设备近年来的一个发展趋势,能够覆盖多个通信标准的单片集成电路成为了迫切的需求。本文以此为思路,采用130nm CMOS工艺,设计了一款覆盖1.2~2.5GHz的宽带射频功率放大器(Power Amplifier,PA)。本文介绍了功率放大器
近年来,由于宽带大容量信息传输及卫星通信等需求的持续增长,微波毫米波频段已经成为国际电磁波频谱资源研究、开发和利用的重要频段。微波、毫米波天线作为微波、毫米波系统中的重要组成部分,有着极其重要的应用。微带天线具有体积小、重量轻、剖面低、结构简单、便于集成等优点,广泛地应用于卫星通信、雷达、相控阵等微波毫米波系统中。同时,具备多层加工条件的低温共烧陶瓷(Low Temperature Co-fire
超密集组网(ultra-dense network,UDN)是5G阶段引起业界普遍关注的技术研究方向和网络站点规划的重要方式。该技术将5G基站小型化、微型化,将通信网络演进成多层超密集异构的形式,使得小区大小和传输距离减小,从而增加单位面积内的小微基站的密度,配合干扰协调技术可以带来显著的传输增益。同时,随着通信网络边缘节点的运算能力的提升以及基站间通信端口性能的逐渐增强,5G网络对各个边缘节点的
信息技术的发展推动着社会的进步,随着无线通信需求的日益增加,未来移动通信系统需要进一步提高通信速率和质量。大规模多输入多输出(Multiple-Input Multiple-Output,MIMO)能够充分挖掘空间资源,在未来移动通信系统向更高频段发展的背景下,其依旧是最具潜力的研究热点。感知通信一体化(Integrated Sensing and Communication,ISAC)旨在将无线
电磁超表面是一种由亚波长尺寸单元周期性或非周期性排列形成的人工二维平面结构。电磁超表面因为其强大的电磁波调控能力,在过去的数十年间获得了研究者们广泛的关注与研究。其在微波和光学等领域获得了一系列应用,包括奇异偏折、RCS缩减、全息成像和超薄透镜等。随着时域数字编码超表面的提出,超表面更是首次具备了调控电磁谐波分布的能力,并逐渐开始被应用于谐波波束调控、宽带频谱隐身、多普勒欺骗和新体制无线通信等领域
作为最新一代的移动通信技术,第五代移动通信技术在第四代移动通信技术的基础上不断发展演进,使得国家、社会发展与国民生活质量得到了前所未有的快速提高。移动支付、网络会议、网上课堂、远程会诊、云诊室等基础服务概念层出不穷,无时无刻不在改变着人民的生产生活方式,提高人民幸福感。除了人民基础生活服务方面,无人驾驶、智能工厂、增强现实、虚拟现实等概念的提出所需要的信息处理能力和传输效率给新一代的移动通信技术带