基于标签语义的图像显著性区域检测算法研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:xkt376
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网科技的进步引发了信息量的急剧增长,互联网图像信息作为其中的重要组成部分,蕴含着丰富的视觉和语义信息。计算机视觉领域的发展能够提升计算机处理图像信息的性能,可以对图像进行更加高效的识别和检测。而显著性检测作为计算机视觉领域的重要分支,其发展对于目标检测、语义分割、无人驾驶等领域都有着重要的研究意义。在图像显著性检测领域,多数方法采用视觉信息作为图像特征,忽略了图像中的语义信息,而语义信息可以让计算机更好地理解图像信息并增强检测效果。针对此不足,本文将图像的标签语义信息作为除视觉特征之外的语义特征,将视觉特征与语义特征相结合,达到丰富图像特征表达、增强图像中显著区域检测效果的作用。同时针对现有的公共数据集中背景简单、类型匮乏的问题,构建了基于标签语义的图像数据集。本文的主要贡献如下:第一,构建了基于标签语义的显著性检测数据集。面向轨道交通领域的应用场景,在公共轨道交通的视频及互联网中收集了 2282张图像,对图像进行了二值图标注和语义标签标注。针对收集到的图像样本不均衡的问题,采用生成对抗网络模型对图像数量进行扩充,为基于标签语义的显著性检测算法设计带来了研究价值。第二,设计了基于卷积神经网络的显著性检测模型。考虑到显著性检测为像素级检测任务,卷积神经网络的深层网络虽然有较高的特征判别性,但经过多次卷积及池化操作后,会丢失一定量的空间像素信息,影响显著性检测的输出结果。本文针对这一问题对卷积神经网络进行优化,将浅层特征与深层卷积特征相融合,并设计了三种不同的网络模型进行对比,通过实验得出了适合本文显著性检测任务的最优结构。第三,提出了基于标签语义信息的显著性检测模型。应用类激活映射方法对图像的显著区域进行检测,并在第二个研究工作的基础上,通过基于CRF的融合方法对视觉特征图和语义特征图进行融合,优化输出的显著图。同时,在公共数据集及构建的数据集上与现有的9种方法对比,实验结果表明本文方法在3种评价指标中检测效果更好。
其他文献
前几天,在一本杂志上看到一篇'读书小札',题目叫做:《重视国外'中国学'》。文章说,当前'中国研究外国,外国研究中国,中国再研究外国人对中国的研究,变得
在山东省淄博市桓台县新城镇张田公路的南侧,屹立着一座壮丽可观的砖石牌坊——'四世宫保'牌坊(见本期封三)。这座牌坊座北朝南,呈中间高、两边低的牌楼形式,牌坊面
道路积水水有旋涡进不得以防掉入水坑中看到积水不趟入避免可能把电触不明路况快折返要过先探水深浅现场不慌不强行服从指挥听交警
<正> 有些语法书把“定语从句”和“同位语从句”归入一类:有些语法书则把它们分为修饰性关系分句和名词性关系分句。本文试图在以下几个方面讨论阐述这两种从句的区别。一、
期刊
对苏丹麦洛维大坝工程施工总平面的设计优化进行了简要描述,总结了工程建设经验,可供类似工程参考。
针对医学微生物实验教学存在的问题,文章初步探索虚拟仿真技术应用于医学微生物实验教学的可行性方案。将虚拟技术与现实教学有效结合,充分发挥虚拟平台的优势,从而不断深入
汾河是山西人民的母亲河,一曲“汾河流水哗啦啦”寄托了三晋儿女对“母亲河”的真挚情感。就是这条承载着三晋文明的悠悠长河,在上世纪末却面临着污染严重、水量锐减等问题。
基于大耳沙蜥能通过振动身体来潜入或浮出沙子这一行为,本文用小球代替大耳沙蜥,用小球的旋转来模仿大耳沙蜥身体的转动,用小球振动来模仿大耳沙蜥身体的振动,利用LIGGGHTS程
单核细胞增生李斯特菌(Listeria monocytogenes,以下简称Lm)是人畜共患李斯特菌病(listeriosis)的主要病原菌,细菌分泌的胞外蛋白对病原细菌的生存与侵染有重要作用。谷氨酸
停车换乘系统是经济发展到现阶段的必然产物。此外,先进的场外停车诱导系统可以引导车辆进入停车场,提高停车换乘停车场的使用率。场内诱导系统可以减少泊车时间,从而增大停车换