【摘 要】
:
视频人脸自动替换技术是计算机视觉领域的一项重要技术,在影视娱乐和社交活动等方面都有着广泛的应用。传统的人脸替换技术需要大量的计算和复杂的人工干预过程,并在精确度、真实感和替换速度上存在一些不足。近年来随着计算机技术的发展,运用深度学习的方法来完成视频人脸自动替换渐渐成为了研究的热点。本文在生成对抗网络模型的基础上,针对上述视频人脸自动替换出现的问题,提出了对应的解决方法,本文的主要研究内容和创新之
论文部分内容阅读
视频人脸自动替换技术是计算机视觉领域的一项重要技术,在影视娱乐和社交活动等方面都有着广泛的应用。传统的人脸替换技术需要大量的计算和复杂的人工干预过程,并在精确度、真实感和替换速度上存在一些不足。近年来随着计算机技术的发展,运用深度学习的方法来完成视频人脸自动替换渐渐成为了研究的热点。本文在生成对抗网络模型的基础上,针对上述视频人脸自动替换出现的问题,提出了对应的解决方法,本文的主要研究内容和创新之处如下:(1)对于人脸自动替换过程中存在的精确度低、真实性差和计算复杂等问题,提出了基于MTCNN的人脸五官精确检测框架和人脸替换框架UFace GAN。首先使用图像特征金字塔加快人脸检测的速度,构建二值人脸特征图作为监督信号,来增强人脸信息的真实度和减少遮挡物带来的不清晰问题。然后为了增加数据复杂度、更好地实现网络拟合,本文对人脸图像进行了数据增强。接着将人脸特征图与人脸图像输入到UFace GAN中,利用编码器学习人脸的共性信息,解码器学习人脸特性信息,通过编码器与解码器间加入跳跃连接的方式来增强人脸的底层信息,并加入了self-attention机制以协调器官之间的细节和整体人脸图像结构,最终得到精确度更高、真实性更强的人脸替换视频。(2)对于视频中人脸存在多姿态难以替换的问题,本文提出了将人脸姿态分类网络与人脸替换网络结合的方法,使用改进的VGGNet作为人脸姿态分类器,UFace GAN作为人脸替换器。在多姿态人脸替换过程中,首先改进VGGNet网络并训练,得到分类准确率较高的人脸姿态分类器。接着人脸姿态分类器可以根据输入图像得到人脸角度参数信息,并将该信息传送到UFace GAN中,UFace GAN根据该参数选择N个通道中的某一通道训练网络模型,最终得到不同人脸姿态的人脸替换视频。在影视视频和拍摄的人脸视频作为视频序列素材的实验证明,本文提出的视频人脸替换方法能够得到精确度高、真实感强、操作简单的人脸替换视频。在CAS-PEAL数据集上的实验证明,本文提出的人脸姿态分类方法能够提升人脸姿态分类的准确率且具有较高的鲁棒性,将其与人脸替换网络融合,可以有效地解决因人脸角度复杂导致的人脸替换困难的问题。
其他文献
随着现代工业的发展,不锈钢材料因其具有优良的耐腐蚀性、耐磨性以及高强度等一系列的综合机械性能,被广泛应用在核电、航空航天以及医疗等高科技领域,此外,对不锈钢零件的钻削加工需求量与日俱增,对加工精度和加工质量的要求也越来越高。然而,由于不锈钢属于典型的难加工材料,其高塑性、低导热系数以及易产生积屑瘤的切削特性使得钻削加工难度不断升高。对于传统钻削加工工艺,由于在钻削过程中常常伴有轴向力大,刀具磨损严
化石能源的过度消耗与环境污染的加剧迫使人们需要开发一种清洁、高效的可再生能源。氢能作为一种极具潜力的新兴能源受到人们的广泛关注。电解水制氢是一种绿色、环保和高效的制氢方式,但其过高的能耗和成本限制了其大规模应用。因此,发展低成本、高活性和高稳定性的非贵金属析氢(HER)电催化剂是解决上述问题的关键。本论文针对高导电性的尖晶石型结构NiCo2S4,通过引入空位和构建异质结构的策略,对其结构进行调控,
随着社会工业的发展,自然水体中各类金属离子浓度逐渐增多,金属离子可通过与有机物的络合作用影响混凝处理效果,也可通过催化等作用影响消毒剂与水体中有机污染物的反应过程,为分析金属离子在混凝过程中对消毒副产物前驱体的影响,本文以两种不同来源的富里酸(FA)作为底物,以硫酸铝和聚合氯化铝(PAC)作为混凝剂,考察络合能力不同的Pb2+和Mn2+对混凝过程的影响,并通过紫外-可见光谱、傅里叶红外光谱(FTI
目前,以Fe-Ga、Terfenol-D与Fe-Co-V合金为代表的磁致伸缩材料被广泛应用于多个领域,其呈现出的高频率、高磁密、微型化、多功能的发展格局对相关器件的影响深远。利用新型磁致伸缩材料研制的高频换能器,应明确其核心驱动部件的磁特性参数以及换能器的结构及输出特性。因此,本文测量并对比了不同种类磁致伸缩材料的高频磁特性,分析了窗式磁致伸缩换能器的结构、多场耦合关系、磁场分布以及特征频率,搭建
近年来,半导体二维原子晶体材料凭借其独特的性质和广泛的应用前景吸引广泛的研究关注。二硫化钼作为二维材料中的典型材料,具有随着层数变化的带隙,具有原子级的表面平整度和稳定性,同时具有超高的表面积体积比,在电子器件、光电器件、传感器和能量器件等领域具有广阔的应用前景。然而,在二硫化钼场效应晶体管中,二硫化钼/金属界面的杂质和接触时的费米能级钉扎效应严重限制了器件性能。因此,优化二硫化钼器件的加工工艺并
肺癌成为中国第一位癌症死因,并且也是全球死亡率最高的癌症。经过临床诊断显示,肺癌患者的五年生存率很大程度上取决于被发现时是早期还是晚期,罹患肺癌的病人越早被发现并被治疗其五年存活率就越高。然而,肺癌早期往往没有明显临床表现,肺癌患者大多数被诊断出癌症时就已经是晚期,丧失最佳治疗机会。因此,肺癌早期诊断至关重要。影像学医师通过肉眼观察来诊断肺癌的最基本依据就是胸腔CT影像。随着CT技术的发展,CT图
目前汽车的人均拥有量逐年增长,对加油站设备的规划建设和运营维护的要求越来越高,而随着人工智能的飞速发展,基于深度学习的目标检测与识别方法逐渐运用到各行业领域中,如何利用有关的理论和技术进行加油站内部设施的自动安全检查,以提高工作效率,节省人力资源和成本也引起了人们的关注。本文主要根据加油站设备安全的相关规范,重点研究了基于深度卷积神经网络的加油站设备识别方法,完成了以下几个方面的工作:1.通过查阅
复杂网络聚类是研究复杂网络的一项基础技术。随着大数据时代的到来,影响聚类的因素和网络中结点的数量不断增加。聚类因素的增加带来了聚类的目标函数增加,网络中结点的增加带来了变量维数的增加。然而,目前的多目标复杂网络聚类算法不能够有效的解决解空间维数和变量维数增加带来的问题。因此,本文提出超多目标复杂网络聚类模型并针对此模型提出超多目标的离散粒子群算法。超多目标复杂网络聚类模型把聚类因素转变成了具体的目
发动机是摩托车的核心部件,其产品性能直接影响摩托车整车的性能。摩托车发动机的生产工厂为了提高发动机的生产质量达标率,在其生产和管理中对发动机的加工质量和装配质量的检测就尤为重要。因此各发动机厂家加强发动机的测试手段,以期在发动机组装整车前将次品检出,提高产品合格率,从而为发动机的改进以及生产质量提供有力的保证。发动机的测试手段有很多种,如批量抽检、冷机磨合、热机空载磨合等方法,但这些手段均是通过间
数控刀具的测量精度和效率是制约中国制造业高精度、高效率发展的关键因素,现有的二维刀具测量仪器无法获取被测刀具的完整三维模型,因此具有一定的局限性。若将三维测量与二维测量相结合,便能弥补二维测量的缺陷,提高数控刀具参数检测的完整性,而目前市场上尚未有国产的刀具三维测量系统,因此基于二维测量系统的数控刀具三维测量系统研究迫在眉睫。本文通过相位测量轮廓术实现对被测刀具的三维重建,具体的研究内容和成果如下