论文部分内容阅读
智能化时代的到来,加速了图像生成技术的发展,特别是以对抗生成网络为代表的图像生成技术的蓬勃发展。目前,图像生成技术可以生成高质量的图像,这些图像和真实世界中使用相机拍摄的图像高度相似,以至于人眼几乎难于区分。另外,由于互联网的快速发展,使得生成图像的威胁也愈发明显。当这些逼真的生成图像被滥用或恶意混淆视听,将对网络信息可信性造成严重的不良影响。针对这一威胁开展的图像取证领域研究已经有一些对生成图像进行检测的算法,但仍存在一些尚待解决的问题。本文的主要成果性工作包括:(1)提出了一种用于提升取证模型泛化性的算法。该研究工作发现目前大多数生成图像取证算法都只针对特定数据集具有很好的检测效果,而对其他数据集的检测存在泛化能力弱的问题。基于此观察,该工作提出使用一种图像预处理的方法来提升取证模型的泛化性。一方面,这种图像预处理的操作可以用来破坏或者抑制图像低层级的取证线索,使得模型不去关注生成图像不稳定的图像特征。另一方面,这种图像预处理的操作可以提升真实图像和生成图像之间在像素层级上的统计特征相似性,可以增加模型训练的难度,迫使取证模型学习到更多与生成算法内在意义相关的特征。实验结果验证了这种图像预处理方法的有效性,可以帮助取证模型提升泛化性能。(2)提出了一种面向多类型生成图像的取证算法。该研究工作发现当前存在的生成图像取证算法大多是一种二分类架构,并且对新类型生成图像的检测性能表现不佳。该工作将生成图像的检测任务视为一个多分类的图像分类任务,提出一种基于深度度量学习的多分类网络模型,并增加了模型的可扩展性。本工作将取证任务视为一个多分类任务,不仅可以将图像分为真假图像两种类型,而且可以对假图像进行更加细粒度的分类。为了应对新类型生成图像层出不穷的现象,该工作建立了生成图像模板库,并通过模型微调使得取证模型的检测性能有了进一步的提升。实验结果最终也表明了该方法架构的优越性。综上,本文对目前存在的生成图像取证算法进行了深入分析和研究,并指出当前取证模型存在的若干问题。本文以深度学习为基础,以生成图像作为研究对象,对生成图像取证算法进行了设计和研究,研究所提出的算法可以有效的解决当前取证领域存在的一些问题,为生成图像取证领域的下一步研究做出了有益的探索与有价值的参考贡献。