基于图像间关联的显著性检测与协同显著性检测方法研究

来源 :上海大学 | 被引量 : 0次 | 上传用户:eacy_tang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像作为自然事物的客观反映,是人类认识世界的视觉基础。近几年来,随着数码相机、智能手机等成像设备的广泛普及,以及互联网的迅猛发展,图像凭借其直观的内容、丰富的表现力和传播的便捷性,成为当今人类社会活动中最常用的信息载体。面对爆发式增长的图像数据,如何自动定位图像中吸引人眼注意力的显著对象区域,即显著性检测,已经成为国内外学术界研究的热点问题。但是,一张图像蕴含的内容毕竟有限,在单张图像上的检测性能往往受到限制。因此,研究者们开始利用原始图像的相似图像,借助相似图像提供的额外信息,来提升原始图像的处理效果。另外,在一些实际场景下,人们的处理目标也不再局限于单张图像,而是需要联合多张图像来分析其相互关系,同时处理一组包含近似对象的图像集合,检测出图像集内共同显著的对象,即协同显著性检测。图像的显著性检测和协同显著性检测是计算机视觉领域不可或缺的基础性研究课题,已经被广泛应用于很多图像处理任务,如语义分割、图像/视频压缩、对象识别及定位等,具有重要的理论意义和研究价值。本论文在探索单张图像信息之外,利用多张图像之间的关联信息,提升显著性检测性能,适应检测共同显著对象的多图像场景。本论文的主要创新和贡献包括:(1)提出了一种借助相似图像的显著性融合模型。首先,搜索输入图像的一组相似图像,并利用已有的显著性检测模型生成输入图像和相似图像的多张显著性图;接着,基于输入图像与每张相似图像的相似度,提出一种自适应融合方法,融合多张显著性图,生成输入图像的显著性融合图;然后,构造输入图像与每张相似图像之间的图模型,将相似图像中比较确定的显著性值,通过一种图像间的显著性传播方法,传播到输入图像中,生成输入图像的显著性传播图;最后,将显著性融合图和显著性传播图进一步融合以生成最终的显著性图。两个公开数据集上的实验结果表明,相比于已有的多种显著性检测和融合模型,本论文提出的模型取得了更好的效果。(2)提出了一种基于多层卷积特征融合和图像间传播的协同显著性检测模型。首先,输入图像和它的四张属于同一图像类别的协同图像经过VGG16网络,提取这些图像的多层卷积特征;接下来,融合这五张图像的多层卷积特征,生成既包含输入图像的个体特征,又包含五张图像协同特征的多尺度综合特征图;然后,利用富含边缘信息的低层特征和富含语义信息的高层特征来进一步增强多尺度综合特征图,生成多尺度增强特征图并融合成为初始的协同显著性图;最后,利用图像间的显著性传播方法,优化初始的协同显著性图,生成最终的协同显著性图。实验在两个公开的数据集上进行,相比于已有的多种协同显著性检测模型,本论文提出的模型取得了最优的性能。(3)提出了一种基于协同特征提取和从高到低特征融合的协同显著性检测模型。首先,将个体特征提取模块作用于目标图像和它的协同图像,生成它们的多层个体特征图;接着,设计了一种协同特征提取模块,利用两种特征提取策略作用于目标图像和协同图像的最高层个体特征图,生成图像间的协同特征图;最后,为了平衡个体信息与协同信息,构造了一个从高到低特征融合模块,通过融合协同特征图和目标图像的多层个体特征图,生成目标图像的协同显著性图。本论文提出的模型在两个公开的数据集上都能一致地获得良好的检测性能,证实了该模型的有效性。本论文通过探索包含近似对象的多张图像之间的关联信息,利用非负二次规划、流形排序、卷积神经网络等技术方法,在图像的显著性检测和协同显著性检测这两个领域进行了深入研究,提出了一种显著性融合模型和两种协同显著性检测模型,取得了具有竞争力的检测性能,有效地推动了显著性检测、协同显著性检测等研究领域的发展。
其他文献
随着先进多媒体的应用和海量设备的接入,对无线容量及频谱效率的需求迅速提高。由3GPP LTE-A提出的非正交多址接入(Non-Orthogonal Multiple Access,NOMA)已成为5G/B5G提高频谱效率、用户访问能力和用户公平性的关键技术。另外,协作通信技术能够有效提高通信范围及系统分集增益;因此本文将NOMA与协作通信技术相结合,重点对协作NOMA技术展开研究。为不断提高系统分
近年来,城市服务和生活品质升级需求引发国内外智慧城市建设热潮,智慧停车系统作为智慧城市建设的重要载体,成为众多学者的重点研究对象。实时、精准和高效的泊位车辆状态信息是驱动智慧停车系统稳定运作的源动力,而作为现阶段泊位车辆状态测量的关键设备地磁车辆检测器,因地磁信号刻画车辆物理属性的局限性和能量资源的有限性,导致现阶段地磁车辆检测器的感知精准度和生命期无法满足智慧停车系统高效且稳定运作的基本诉求。为
行政价值观是行政主体(政府)对行政客体(行政系统)实施管理实践过程中所形成的价值追求和价值理解,代表着国家的根本利益,具有鲜明的阶级性。中国作为人民民主专政的社会主义国家,其社会主义的本质决定了中国政府的核心价值追求始终是一切为了人民,显著的人民性是中国行政价值观与西方行政价值观最本质的区别。改革开放以来,中国行政价值观的关注重点从以经济为中心,逐渐拓展到经济、政治、文化“三位一体”和经济、政治、
清初书法,碑风兴起。鉴于晚明时期“尚奇”的审美倾向,清初书法开辟出一条“因奇尚拙”的金石书画道路。石涛便是清初践行以“金石入书画”的书家之一。石涛在诗、书、画、印各方面均有造诣,加之其身份复杂,经历坎坷,交友广阔,善于思考,个性矛盾等特点,使得其艺术作品极具张力,于清初江南地区有一定影响力。石涛十岁习书,而后学画。他的学书不同于其画,虽然石涛提倡书画的“无法”之道,在书法上却表现出了汲取魏晋、唐宋
随着计算机和通信技术的迅速发展,三维视频(Three Dimension Video,3DV)逐渐替代二维视频(Two Dimension Video,2DV)成为下一代主流视频技术。人们观看3DV能获得丰富的立体感和沉浸感。自由立体显示技术的兴起,不仅使观众摆脱了眼镜的束缚,还向观众提供了视点交互选择功能。系统根据用户需求呈现相应视点的3DV。多视视频巨大的数据量,对信息传输基础设施形成挑战。深
肿瘤化疗依然是当今癌症治疗的重要手段。然而,肿瘤化疗常常失败,癌症的多药耐药性和转移性进展是导致化疗失败的两个主要原因。纳米技术的发展为解决上述问题提供了新机遇。当今纳米药物研究主要是开发纳米载药系统,纳米药物本身仅仅是传统药物的一类制剂或者配方的改进,尚未在纳米尺度上开发出作用机理独特的原始创新药物进入临床。近年来,石墨烯材料因其独特的二维平面结构以及蕴涵的新奇物性引起了全球科学家广泛而持久的关
目前在运行的三值计算机有两种:三值光学计算机和三值电子计算机。前者以三值光学计算机原型系统“上大2016”(简称为SD16)为代表,后者以三值电子运算器“上大2018”(简称为SD18)为代表。二者彰显了这类新型计算机的五大特色:三值、运算器位数众多、运算器按位可分组独立使用、运算器按位可重构和无进位并行加法器。随着三值处理器、三值计算机底层监控软件雏形和任务管理软件雏形的建立,基于这种新型计算机
肺癌在所有的癌症中是最常见、最致命的癌症之一。其死亡率和发病率在男性和女性中均位居前列。肺癌分为两类,分别是约占到15%的小细胞肺癌(Small cell lung cancer,SCLC)和约占到85%的非小细胞肺癌(Non-small cell lung cancer,NSCLC),具有高复发率和高转移率的特征。微小RNA(micro RNA,miRNA)是一类单链非编码RNA分子,约18~2
风灾造成的建筑结构破坏,不仅仅带来了难以估量的巨大经济损失,也带来了对人民群众生命安全的威胁。于是,对于现场实测风场的研究和对于风压模拟方法的探讨就变得十分重要。一般来说,在结构迎风面测得的风压数据显示高斯特性,而在结构复杂区域以及风场分离流和漩涡流区域常常显示非高斯特性。这一特性导致压力脉动图有很多尖峰点存在,从而导致这些结构部位更容易发生疲劳破坏。风场非高斯特性作为导致结构破坏的重要因素,值得
边坡稳定性问题是土力学中的经典问题之一,如何对边坡安全性进行准确和可靠的评估一直是岩土工程师们关注的重点。到目前为止,对边坡稳定性的研究大部分是基于二维方法,边坡三维稳定性方面的研究工作还相对较少。我国大部分地区处于干旱或半干旱地区,土中吸力对边坡稳定性的影响引起研究者们广泛的关注。但是,对非饱和土边坡稳定性的研究大多是基于二维极限平衡法或有限元分析法,目前非饱和土边坡三维稳定性极限分析方面的研究