基于关系视觉注意机制的场景图生成方法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:zdx_comeon
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着深度学习的快速发展,一些计算机视觉任务已经取得巨大进展。但是,想要更深入地理解图像中包含的语义信息,目前仍然面临着许多问题与挑战。场景图生成任务用于描述图像中目标间的关系,构建出场景语义信息,可为图像描述、视觉问答等任务提供指导信息,这使其成为图像解译研究的关键环节。本文分别从三个方面对场景图生成技术进行探索和创新:(1)提出了基于关系视觉注意机制的场景图生成方法。该方法针对关系在图像中不存在具象的特征表示与其对应,以及现有方法学习到的关系表征所关注区域与发生关系位置对应较差的问题而展开研究的;所谓关系不存在具象表征是指发生该关系的位置在不同图像中是变化且不固定的,因而就不存在具体且明确的视觉表征与其对应。本文依据关系不存在具象表征的特点,通过挖掘两目标间的交互信息,提出了关系视觉注意机制。该机制将两目标分别作为关系对中的主语和宾语进行信息交互,通过关系注意力转移函数,利用主语和宾语信息实现注意力转移;通过将主语和宾语的信息交替迭代,学习到两目标间的内在关联,得到关系表征并用于最终关系检测。通过可视化以及与现有方法进行对比试验,结果表明该方法学习到的关系表征可以关注于两目标发生关系的区域,同时在评价指标方面具有优越性。(2)提出基于选择目标关系的场景图生成方法,并结合现有方法验证其有效性。对于图像中的目标,并不是所有的目标对都有可能产生关系,所以通过提前选取有可能产生关系的目标对并去掉无效组合,将会在很大程度上提升模型的效率。本文建立了两种不同的目标关系选取方法:基于关系偏置的关系选取方法,通过分析数据集建立关系选取字典进行关系选取;基于加和池化的关系选取方法,通过建立深度学习模型自主学习关系的选取。通过对比实验表明两种方法各有侧重,但均可以对无效关系进行提前筛选,减少在关系预测时的无效检测。(3)提出基于关系约束损失的场景图生成方法。针对基于关系视觉注意机制的场景图生成方法中存在的关系表征关注区域比较分散的问题,在其基础上提出了两个损失函数:关系约束损失函数和目标框约束损失函数。根据两目标间发生关系的区域存在于其相互接触的部分,提出关系约束损失函数,用于约束关系表征更加聚集地关注于产生关系的区域。同时,为增强关系约束损失的约束效果提出目标框约束损失函数,用于度量预测的目标框之间存在的交集情况与标注间的差异,使产生更加准确的场景图。消融实验以及与其它方法的对比实验结果验证了该方法的有效性。
其他文献
有机废水中包含了大量的有机物,采用厌氧生物技术将这些有机污染物降解并转化为能源气体甲烷(CH_4)被认为是实现其资源化的一种有效途径。但是,厌氧生物降解和转化为CH_4所需水力停留时间(HRT)长,效率低。因此,本文拟通过向厌氧生物体系中投加具有高稳定性的导电聚吡咯(PPy)来提高厌氧生物体系中胞外电子传递速率,进而提高废水厌氧生物处理过程中产CH_4性能。本文采用化学氧化法制备得到了导电PPy材
萌生现象是植物尤其是木本植物最为常见的生活史特征之一,也是除种子更新外,最常见的更新方式之一,它和实生更新一样是植物繁衍后代的一种重要方式,近年来许多学者对于植物萌
同声传译,是指译员在不打断讲话者讲话的情况下,将源语言翻译为目标语言,不间断地将内容口译给听众的一种翻译实践。本报告选取交通领域专家刘岱宗的演讲《未来交通与创新城市》为材料进行模拟同传实践,旨在对本次同传实践进行总结反思,并相对应地提出处理口译过程中难点的口译策略。本报告以释意理论为指导。释意理论以交际为视角,提出翻译是一种交际行为,因此利用释意理论可以帮助口译实践取得更好的交际效果。本报告将选取
当前我国整体经济持续增长,区域经济得到全面发展,城镇化建设不断加快,城镇居民生活质量不断提高。但城镇化建设也带来了一些弊端,如流动人口增加、城市交通拥挤、居民安全问题频发、城市社会矛盾日益复杂化等。由此,城市管理执法的地位和重要性日益突显。本文以宿迁市宿城区为例,运用公共管理相关的知识,结合宿迁市城市管理综合执法的实际情况,对其问题和原因进行探析,最终提出相关完善对策。本文采取了文献研究法、问卷调
公共政策本身并非原子化的存在,而是具有系统性(contextuality),即镶嵌(embed)在特定的时空情境系统之中的。所有的政策结果的产生与政策现象的形成都可以看作是政策本身与情境系统相互激荡影响的结果。依照此理,政策变迁便是指镶嵌在特定的政策系统中,具有主导社会价值配置的权威规则(包括政策和广义的制度),随着系统的更迭而产生一定程度变化。因此,政策变迁是由政策本身与系统相互激荡所形成的结果
随着煤矿逐渐地转向深部开采,工程灾害问题频发,为保障人身安全及减少财产损失,除了研究工程岩体本身固有力学特性之外,还要考虑多种人为和自然因素对工程岩体的影响,如开采扰动引起的应力场和地质环境等。在巷道或煤层开挖之前,煤层及顶底板围岩处于稳定和平衡的三向应力状态。随着巷道的掘进及煤层的开采,围岩多经受复杂的加载和卸载过程,且不同的掘进和开采方式,产生不同的应力路径和采动影响,进而使围岩的变形、强度及
伴随着经济的稳步增长,我国的城镇化发展也保持着较高的速度,带动了建筑产业的腾飞。但我国建筑业发展中依旧存在着如成本高、能耗高、行业垃圾多、行业水平有待提高等诸多问
稀土离子上转换发光是一个反斯托克斯过程。稀土上转换发光材料由于具有发光稳定性好,效率高,耐高温,不易发生化学反应等优势,而被广泛应用于激光防伪、生物成像、光催化、太阳能电池等领域,近年来得到了科研工作者极大的研究兴趣。另外,由溶胶-凝胶方法制备的有机-无机复合材料兼具有机材料和无机材料的优点,通过改变材料中有机组分和无机组分的种类或者在材料中摻杂不同的功能基团,可以制备得到具有优良光学性能的功能复
正交频分复用(Orthogonal Frequency Division Multiplexing,OFDM)由多载波调制技术发展而来,是一种并行高速传输技术,具有频谱利用率高、抗干扰能力强等特点,因而被广泛用于现代无线通信中。在OFDM中,存在相位相同或相近的子载波,其叠加信号受到相同初始相位的调制,会出现较大的峰均功率比(Peak-to-Average Power Ratio,PAPR)。高P
随着“一带一路”战略的广泛实施和与东南亚国家合作的不断开展,我国的对外交流也走入了新篇章。本文选择了新加坡总理李显龙2018年在国庆群众大会上的中文演讲作为题目。新加坡作为东南亚的一个重要国家,其华人总数占了总人口的75%,他们的祖先很大一部分是福建、广东的移民,与我国有许多相同的文化渊源。因此,以此篇讲话作为研究对象,能使我们更加深入地了解到新加坡社会,尤其是新加坡华人群体,增进中国和东南亚国家