图像语义分割中的上下文信息融合算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:qx552801
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图片是一种重要信息载体。随着移动设备和互联网的普及,人们越来越多地通过图片来记录生活的点点滴滴。与此同时,随着人工智能技术的高速发展,如何让机器像人类一样自动高效地理解图片中的语义信息获得了空前的关注,促进了语义分割技术的出现和发展。语义分割在多种真实应用场景中都存在着巨大的需求,是自动驾驶、人物行为分析、医疗诊断等多种技术的基石,为未来的智能时代勾画了一个美丽的蓝图。
  然而,图片质量的差异性U不同的光照条件、遮挡、分辨率等V和图片内容的复杂性U多种多样的场景和物体类别V为语义分割任务提出了巨大的挑战,导致分割结果中常常出现语义不一致的情况。近年来,越来越多的工作聚焦于利用上下文信息来改善上述不一致问题,并且取得了显著的进展。本文分析了以往方法潜在的弊端,针对场景语义解析和人体语义解析两个重要的语义分割任务,分别设计了一套高效的上下文信息融合算法:
  RX针对场景语义解析任务的特性,本文提出了一种高效的上下文信息融合方法,有效融合了特征图中的长程上下文信息。该融合方法中引入了一种新颖的空间金字塔采样机制,并与标准的非局部模块巧妙地结合在了一起,大幅降低了特征图中长程上下文信息融合过程的计算复杂度。相比标准的非局部模块,本文的方法将运行时间缩短了e倍左右,同时将模块的:Sl显存占用降低了k3倍。在三个场景语义解析数据集上的实验结果验证了本文的融合方法的有效性和高效性。
  kX针对人体语义解析任务的特点,本文设计了一种灵活的上下文信息融合方法,其能够有效地利用特征图中每个像素邻近区域的上下文信息,并且可以方便地调整算法中考虑的邻近区域的大小,避免引入无关的干扰信息。在单人和多人语义解析数据集中,本文的融合方法都展现了优越的性能和效率。此外,在真实视频监控数据集上的跨数据集实验验证了本文的方法的泛化性和鲁棒性。
  基于以上研究,本文分别提出了适用于场景语义解析和人体语义解析任务的上下文信息融合算法,能够准确地识别并分割图片中的物体,有效改善了语义分割中的语义不一致问题。
其他文献
由于超低频(Super Low Frequency, SLF)通信具有穿透性好、抗干扰能力强、信号稳定等优点,被广泛应用于军事对潜通信、透地通信等领域。目前超低频通信系统大都是敷设百米甚至千米量级的电调天线作为发射天线,体积较大且无法灵活移动,因此,美国国防部高级研究计划局于2017年提出研发频率在30kHz以下的便携式超低频通信系统。为了减小天线的体积,本文用结构紧凑的线圈代替传统电调天线,收发线圈利用感应磁场传输信息,这种磁感应通信方式下有关超低频信号传输衰减规律的理论研究较少,因此,研究超低频磁感应
全球导航卫星系统(Global Navigation Satellite System,GNSS)正在扮演着越来越重要的角色,同时也在面临着各种各样的挑战。当前卫星导航信号的扩频调制方案是直接序列扩频(Direct Sequence Spread Spectrum,DSSS),而截获技术的发展给DSSS信号的安全性带来了严重的威胁。本文旨在研究新型的扩频调制方法,以提高卫星导航信号的抗截获能力,提升GNSS的安全性和可靠性。
  本文以提升卫星导航信号的抗截获能力为目标,提出了一种跳相扩频调制方法,
伴着一场大雪,北京迎来了2010年,21世纪第二个十年的开始。  2010年,作为时间轴上的新坐标,它本身并没有特别的含义,和每天的日出日落一样,平凡而新鲜。但当时间和人们的期望与梦想结合在一起就变得不太一样。  已经过去2009年,我们在去年第12期杂志上做了全面的盘点。面对新年,数码圈又将会有怎样的风景7全球最大的消费电子展CES2010即将召开,新一年的技术和产品也慢慢揭开面纱,向人们展示新
期刊
文本检索旨在对给出的查询,在文档集合中找出与之最相关的文档子集。它能有效地对文档中的语句词义进行压缩整合,并与查询进行匹配,利用计算机在处理海量数据上的优势,为人们迅速缩小查阅的范围,极大地提高了筛选与处理信息的效率。本文在对文本检索模型进行研究时发现,文本检索主流模型采用的是构建输入查询与文本的表示,文本与查询的关系取决于表示的相似程度。这种模型往往存在无法解决长距离依赖、无法对语义很好地建模的问题,导致模型的向量表示不能准确地表示出文本的语义信息。因此,本文认为目前的主要挑战是如何对原文本进行更好的向
文本风格转换旨在转换文本的风格,而不改变语义内容,是一种可控的文本生成任务,易与其他自然语言处理任务融合,具有重要的研究价值。由于缺乏内容相同而风格不同的平行语料,需借助无监督学习来实现文本风格转换。本文重点研究了基于风格联合表征与内容对齐循环重建的无监督文本风格转换方法。设计了基于对抗性变分自编码器的无监督文本风格转换模型。通过鉴别器与变分自编码器的对抗性训练,将源端句子的内容和风格在潜在空间进行分离,得到与风格无关的文本内容表示。将目标风格的表示和文本内容表示一起作为生成器的输入,从而生成目标风格的句
随着社会的快速发展,无线通信已经逐渐发展成为人们的基本生活需求之一。当前,无线通信系统采用跳频和直扩方式来抗截获以及抗侦收,随着截获能力和信号识别处理算法能力的提高,跳频和直扩方式抗截获以及抗侦收能力显得日益薄弱。跳相扩频调制能在不增加系统带宽的情况下,提高无线通信系统的抗检测性能、抗截获性能以及抗侦收性能。为了防止非合作方窃取有效的信息,服务于跳相扩频调制的跳相序列应该具有良好的随机性、复杂性和不可预测性。本文具体工作如下:
  研究了伪随机序列相关理论,跳相扩频调制方法。针对跳相扩频特点,提出了
低轨卫星通信在通信领域具有重要意义和广阔应用前景。本文重点研究了Polar码在低轨卫星通信中的性能,并在块衰落信道下提出了改进的极化重量构造算法,具有重要的理论与实际意义。
  本文根据信道传输特性随时间变化的快慢程度,将低轨卫星信道分为信道缓慢变化、固定周期缓慢变化和快速变化三种情况并分别建模为高斯信道、块衰落信道和Corazza信道。同时,在介绍了Polar码的基本原理和编译码算法的基础上,研究了Polar码的构造算法。在块衰落信道下,本文将衰落系数的作用看成是“衰落极化”的过程,提出了改进的极
科技的进步,推动社会的发展,为各行各业带来滚滚财源的同时,也使人们能享受越来越好的生活。在过去的20年间,科技上的进步带动经济高速发展,而人们,也因科技将生活变得更美好,当现代生活变得越来越复杂时,智能计算帮助我们化繁为简。至于未来,那些现在看起来是不可思议的事情,在将来或许就如电脑之于今天一样普通。  记忆,是个奇怪的功能,有些东西时间越久记忆越清晰,有些不久之前的事情,倒仿佛发生在遥远的上古世
期刊
图像表示是图像的基础,不同类型的表示以不同角度展示着图像的不同特征。例如,基于像素的表示直接地使用像素颜色、纹理或亮度对图像的每个像素进行表示,提供着图像的低层特征;而基于区域的表示则使用有意义的标签对图像的区域进行赋值,关注于图像的高层语义。某种意义上讲,图像处理和计算机视觉可以看作是对图像提取特征并将其转化为另一种图像表示的过程。
  最近的深度卷积神经网络使用着不同的图像表示进行监督,学习去解决不同的视觉任务。然而,本人发现,对于密集语义预测的任务,传统的图像表示通常忽略了像素之间的空间关系,
图片是人类传播信息的重要媒介。近年来计算机视觉的蓬勃发展离不开大量的图片和其标注。研究如何能自动化生成数据可以降低标注工作量,也能满足人类特定化编辑图像的需求。作为生成任务中的一种,变形图像生成因输出和输入存在极大的结构差异而极具挑战性,但其巨大的实际应用价值吸引着学者们不断进行深入调研。
  考虑到生成对抗网络在图像生成上的优异表现、泛用性和灵活性,本文对生成对抗网络进行结构和方法调整,用于应对两项极具应用价值的变形图像任务:中国书法生成和姿态变换。针对两项任务的特点,展开了如下研究: