图像质量评价中的对抗学习研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:th3966733
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像相较于文字而言,传递信息的方式更为简单直接,因此运用更为广泛,但图像在采集、传输和使用过程中,往往会引起不同程度的失真,这就需要质量评价算法对其进行评估。现阶段图像质量评价的主流算法大多基于机器学习(特别是深度学习),现有研究表明机器学习算法对数据的对抗性扰动极其不稳定,存在鲁棒性和安全性问题。基于此本文研究了一系列的对抗性扰动样本来攻击现有图像质量评价算法,找出其漏洞,希望本文的攻击方式能让图像质量评价算法的研究向着更加实用性方向发展,也希望对质量评价算法安全性的研究和完善起到助力作用。本文的主要研究内容和成果如下:(1)提出了基于微距摄影图像的质量评价数据库,用以攻击现有质量评价算法。微距摄影图像是指主体清晰背景模糊的一类图像,这一类型的图像因其具有朦胧美的特征而深受大家的喜爱。本数据库包含100张参考图像和800张失真图像,被大约60名本专业相关的受试者进行评估得到DMOS评分。本数据库对6种全参考质量评价算法(PSNR、GMSD、FSIM、RFSIM、SUMMER)以及6种无参考质量算法(BIQI、BRISQUE、SSEQ、CNN、ASIQE、ENIQA)进行评估校验,以上算法在本数据库上的评分效果均较差。(2)提出了一类基于动量迭代梯度攻击质量评价算法的对抗样本生成方法。该方法除了使用梯度迭代扰动输入以使损失函数最大化的基于梯度方向外,还引入了动量的方法使整个迭代过程中在损失函数的梯度方向上累计速度矢量,以生成成功攻击质量评价算法的对抗样本。本方法在攻击现有基于神经网络的图像质量评价算法中,都体现了较高的成功率。为了验证本章节中对抗样本的可转移性,本章还研究了多个传统IQA模型,结果表明,基于深度学习模型生成的对抗样本在传统IQA模型上依然能够保持其对抗性。(3)提出了基于人眼视觉系统下的主体、背景域噪声添加攻击图像质量评价算法的对抗样本生成方法。该方法在上一章节的基础上,添加更少的噪声,且结合了人眼观测图像时对主体区域的强关注,分别对主体部分和背景部分进行扰动,且扰动类型不再局限于一种,而是5种失真扰动分别添加。实验结果表明,虽然该方法添加了更少的扰动,但生成的对抗样本攻击质量评价算法时,攻击效果显著,评估算法性能时的SROCC、PLCC降低很多。
其他文献
高脂饮食是前列腺癌发展的重要危险因素。棕榈酸是膳食脂肪酸中最常见的饱和脂肪酸,也是脂肪酸合成酶(Fatty acid synthase,FASN)的主要终产物。已有许多研究表明,FASN在多种癌症中呈高表达,而FASN表达水平的增高会导致体内合成脂肪酸增多。有研究报道称,肿瘤细胞的增殖依赖于内源性的脂肪酸合成。然而,富含棕榈酸饮食对前列腺癌发生发展的影响少有报道。因此,本文旨在研究富含棕榈酸饮食在
计算机视觉是计算机领域研究的重要分支,一直以来倍受学者、专家关注。其中机器视觉中的单目标跟踪方向,由于其在实际生活中被广泛应用,一直以来成为被研究的热点。目标跟踪任务因其跟踪的目标本身的不确定性以及其跟踪环境的复杂性,会面对诸如目标遮挡、尺寸变化、运动模糊以及长时间跟踪等问题。因其应用场景的复杂性,这就要求跟踪算法有较强的环境适应能力,即良好的鲁棒性。本文针对目标跟踪面对的难题,提出一系列的解决方
随着社会各方的需求、信息化的推进以及计算机视觉的发展,微表情识别领域得到了越来越多的关注,研究人员对其所进行的研究越来越深入。在商务谈判、刑事审讯、心理治疗等场合中人们会有意无意的隐藏自己的真实情绪以此来达到他们的目的,微表情是人类的肌肉语言,在此类情况下使用微表情识别的结果作为判断依据,可靠性则会大大提升。微表情区别于寻常宏表情的显著特点:(1)持续时间短(1/25-1/5秒);(2)肌肉运动幅
视觉目标跟踪是计算机视觉领域的一个重要分支,在智能视频监控、无人驾驶、人机交互等多个领域有着重要应用。本课题的研究内容是单目标跟踪,表现形式为在第一帧提供待跟踪的任意单个物体,在接下来的图像序列中,跟踪算法应当准确、实时地预测目标的位置。由于第一帧提供的信息有限,不足以应对后续跟踪场景的复杂性与多变性,同时,跟踪器的速度要满足实时性,这些难点使得视觉目标跟踪一直是一个极具挑战性的任务。如何设计一个
图像融合是将在同一场景下,通过不同传感器获得的图像综合成一幅新的图像,使得融合图像具有更丰富的细节信息,对场景内的所有物体都能够清晰的识别,从而便于后续进一步的图像处理和分析。随着对图像融合领域的深入研究,图像处理的手段越来越丰富。以曲波变换、轮廓波变换、剪切波变换、非下采样剪切波变换(Non-Subsampled Shearlet Transform,NSST)等为例的多尺度变换工具能够对图像进
运动目标检测与跟踪技术作为计算机视觉领域重要研究方向之一,其被广泛应用于智能监控、交通系统和人机交互等多个领域。而在实际的应用场景中,往往存在动态背景、光照变化、遮挡、尺度变化和快速运动等复杂干扰的影响,给运动目标的检测与跟踪产生巨大的困难和挑战。本文针对鬼影及阴影的消除方法、特征融合方法和模型更新策略进行研究,具体研究工作如下:(1)针对视觉背景提取(Visual Background Extr
自旋转移力矩随机磁存储器(STT-MRAM)是一种新型的非易失性存储器,被认为是最具有潜力替代Flash的新型存储器之一,在未来的各行各业均具有广泛的应用前景。本论文针对STT-MRAM外围电路的两个主要组成部分:读电路和写电路,进行了相关的设计与研究。首先,针对深纳米级的STT-MRAM,设计了一种具有动态参考和可变容差的新型读电路,实现了极高的传感裕度(SM)和较小的读取干扰(RD);然后,设
视觉目标跟踪经常被应用于无人机、视频安防、智慧城市等领域,其任务是给定初始帧中待跟踪目标物体的信息,在后续视频帧中预测目标的实际位置和尺寸大小。在复杂背景环境下既保证跟踪精度又保证跟踪速度是视觉目标跟踪任务的难点。本文以深度孪生网络结构为基础,针对当前视觉目标跟踪算法中存在的难点问题展开研究,具体研究成果如下所述:(1)通常卷积网络提取到的特征包含低层、中层和高层抽象信息。许多孪生网络类跟踪算法在
信息物理系统(Cyber Physical Systems,CPSs)是将传感、通信、计算和控制过程高效结合而形成的复杂系统。目前,信息物理系统已在智能电网、医疗监测、智慧工厂、智能交通等众多领域得到广泛应用。不同于以往封闭式的工业内部网络,通讯网络的接入极大地提高了系统运行效率同时,也带来了许多安全问题。近年来针对信息物理系统的攻击事件频频发生,造成巨大的经济和社会损失,这已经引起了国内外相关学