基于像素关系的方向场表示及其应用研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:dyqxcici
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像表示是图像的基础,不同类型的表示以不同角度展示着图像的不同特征。例如,基于像素的表示直接地使用像素颜色、纹理或亮度对图像的每个像素进行表示,提供着图像的低层特征;而基于区域的表示则使用有意义的标签对图像的区域进行赋值,关注于图像的高层语义。某种意义上讲,图像处理和计算机视觉可以看作是对图像提取特征并将其转化为另一种图像表示的过程。
  最近的深度卷积神经网络使用着不同的图像表示进行监督,学习去解决不同的视觉任务。然而,本人发现,对于密集语义预测的任务,传统的图像表示通常忽略了像素之间的空间关系,隐性地导致了结构和几何信息的丢失。在本文中,本人考虑使用一种基于像素关系的方向场表示解决上述问题。本人将传统的图像表示转化为本人提出的形式,由此约束网络直接地学习像素之间的空间关系,在特征学习的过程中强调了结构和几何信息。为了证明提出的基于像素关系的方向场表示的有效性,本人在两个视觉任务上提出了具体解决方案并进行了实验,分别是物体骨架提取和场景文字检测,两者均与图像中的结构和几何特性密切相关。
  骨架是一种基于结构的物体描述子,表征着物体形状的几何和拓扑特性,展现着物体各部分的局部对称性和连通性。自然图像中的物体骨架提取任务由于物体外观和尺度的变化较大以及处理背景的复杂性而非常具有挑战性。现有的基于学习的方法将这个任务看作是像素二分类问题,本质上和基于学习的边缘检测以及语义分割方法类似。在本文中,本人充分利用基于像素关系的方向场表示,并由此提出了一种新颖的“骨架关联区域流量”,其中包含了关联区域每个像素到骨架像素的映射。相比于之前的方法,骨架关联区域流量有着两个优势:首先,它编码了骨架像素和其他语义实体,例如关联区域像素以及隐含的边缘像素的相对位置关系;其次,骨架关联区域流量是一种基于区域的方向场,能够更好地应对具有较大宽度的物体部分。本人随后展示了一种新颖的方法,称为“DeepFlux”,来准确定位物体骨架。本人在五个数据集上评价了本人的方法,一致地取得了当时最好的结果。
  场景文字检测是场景文字理解的重要一步。其主要的挑战在于文字多变的尺度、长宽比,以及任意方向和形状。受深度学习最近进展的驱动,研究人员们在多方向文字检测上已经取得了非常好的性能。然而,受限于传统的文字表示(例如水平矩形框,旋转矩形框,一般四边形或二值掩膜),大多方法的性能在曲形文字检测上急剧下降。曲形文字实际上在自然场景中非常常见,因此曲形文字检测也相当重要。在本文中,本人同样充分利用基于像素关系的方向场表示,并由此提出了一种新颖的“文字方向场”,其中的方向远离最近的文字边界指向每个文字内的点。这种表示不仅编码了二值文字掩膜,也包含了结构和几何信息,可以进一步用来分开邻近的文字实例。本人随后展示了一种新颖的方法,称为“TextField”,来检测任意形状的场景文字。充分的实验结果表明,本人提出的方法在两个曲形文字数据集上大幅超过了当时最好的方法的结果,同时在两个多方向文字数据集上也取得了非常有竞争力的结果。此外,本人的方法对未见过的数据集具有较好的泛化性能。
其他文献
近年来,物联网和移动互联网的高速发展对无线网络的网络速率、连接密度、链路时延和用户体验提出了更高的要求。随着通信技术的发展和硬件性能的提升,认知无线电、软件定义网络、感知网络、软件定义空中接口等概念被相继提出,具有环境感知能力的无线网络逐渐走入学术界和工业界的视野。与传统无线网络相比,这样的无线网络能够感知、分析和理解网络环境,实时调整网络参数,从而适应网络环境的变化,是未来无线网络发展的新方向。
  本论文立足于无线网络的真实环境和实际场景,对基于环境感知的无线网络接入方案展开详细研究。首先研究复
滤波器组多载波-偏移正交幅度调制(FBMC-OQAM)具有高频谱效率以及低带外辐射等优点。但是作为一个多载波通信系统,FBMC-OQAM系统存在峰均比(PAPR)比较高的问题。本文对如何降低FBMC-OQAM系统的PAPR展开了研究,在经典的部分传输序列(PTS)算法的基础上,针对FBMC-OQAM系统提出了两种改进算法。
  在多载波系统中,频域中每个子载波幅度的改变会影响时域中的叠加波形。基于这一特性,本文首先在传统PTS算法的基础上对FBMC-OQAM信号在频域上进行幅度加权,提出了频域加权的
由于超低频(Super Low Frequency, SLF)通信具有穿透性好、抗干扰能力强、信号稳定等优点,被广泛应用于军事对潜通信、透地通信等领域。目前超低频通信系统大都是敷设百米甚至千米量级的电调天线作为发射天线,体积较大且无法灵活移动,因此,美国国防部高级研究计划局于2017年提出研发频率在30kHz以下的便携式超低频通信系统。为了减小天线的体积,本文用结构紧凑的线圈代替传统电调天线,收发线圈利用感应磁场传输信息,这种磁感应通信方式下有关超低频信号传输衰减规律的理论研究较少,因此,研究超低频磁感应
全球导航卫星系统(Global Navigation Satellite System,GNSS)正在扮演着越来越重要的角色,同时也在面临着各种各样的挑战。当前卫星导航信号的扩频调制方案是直接序列扩频(Direct Sequence Spread Spectrum,DSSS),而截获技术的发展给DSSS信号的安全性带来了严重的威胁。本文旨在研究新型的扩频调制方法,以提高卫星导航信号的抗截获能力,提升GNSS的安全性和可靠性。
  本文以提升卫星导航信号的抗截获能力为目标,提出了一种跳相扩频调制方法,
伴着一场大雪,北京迎来了2010年,21世纪第二个十年的开始。  2010年,作为时间轴上的新坐标,它本身并没有特别的含义,和每天的日出日落一样,平凡而新鲜。但当时间和人们的期望与梦想结合在一起就变得不太一样。  已经过去2009年,我们在去年第12期杂志上做了全面的盘点。面对新年,数码圈又将会有怎样的风景7全球最大的消费电子展CES2010即将召开,新一年的技术和产品也慢慢揭开面纱,向人们展示新
期刊
文本检索旨在对给出的查询,在文档集合中找出与之最相关的文档子集。它能有效地对文档中的语句词义进行压缩整合,并与查询进行匹配,利用计算机在处理海量数据上的优势,为人们迅速缩小查阅的范围,极大地提高了筛选与处理信息的效率。本文在对文本检索模型进行研究时发现,文本检索主流模型采用的是构建输入查询与文本的表示,文本与查询的关系取决于表示的相似程度。这种模型往往存在无法解决长距离依赖、无法对语义很好地建模的问题,导致模型的向量表示不能准确地表示出文本的语义信息。因此,本文认为目前的主要挑战是如何对原文本进行更好的向
文本风格转换旨在转换文本的风格,而不改变语义内容,是一种可控的文本生成任务,易与其他自然语言处理任务融合,具有重要的研究价值。由于缺乏内容相同而风格不同的平行语料,需借助无监督学习来实现文本风格转换。本文重点研究了基于风格联合表征与内容对齐循环重建的无监督文本风格转换方法。设计了基于对抗性变分自编码器的无监督文本风格转换模型。通过鉴别器与变分自编码器的对抗性训练,将源端句子的内容和风格在潜在空间进行分离,得到与风格无关的文本内容表示。将目标风格的表示和文本内容表示一起作为生成器的输入,从而生成目标风格的句
随着社会的快速发展,无线通信已经逐渐发展成为人们的基本生活需求之一。当前,无线通信系统采用跳频和直扩方式来抗截获以及抗侦收,随着截获能力和信号识别处理算法能力的提高,跳频和直扩方式抗截获以及抗侦收能力显得日益薄弱。跳相扩频调制能在不增加系统带宽的情况下,提高无线通信系统的抗检测性能、抗截获性能以及抗侦收性能。为了防止非合作方窃取有效的信息,服务于跳相扩频调制的跳相序列应该具有良好的随机性、复杂性和不可预测性。本文具体工作如下:
  研究了伪随机序列相关理论,跳相扩频调制方法。针对跳相扩频特点,提出了
低轨卫星通信在通信领域具有重要意义和广阔应用前景。本文重点研究了Polar码在低轨卫星通信中的性能,并在块衰落信道下提出了改进的极化重量构造算法,具有重要的理论与实际意义。
  本文根据信道传输特性随时间变化的快慢程度,将低轨卫星信道分为信道缓慢变化、固定周期缓慢变化和快速变化三种情况并分别建模为高斯信道、块衰落信道和Corazza信道。同时,在介绍了Polar码的基本原理和编译码算法的基础上,研究了Polar码的构造算法。在块衰落信道下,本文将衰落系数的作用看成是“衰落极化”的过程,提出了改进的极
科技的进步,推动社会的发展,为各行各业带来滚滚财源的同时,也使人们能享受越来越好的生活。在过去的20年间,科技上的进步带动经济高速发展,而人们,也因科技将生活变得更美好,当现代生活变得越来越复杂时,智能计算帮助我们化繁为简。至于未来,那些现在看起来是不可思议的事情,在将来或许就如电脑之于今天一样普通。  记忆,是个奇怪的功能,有些东西时间越久记忆越清晰,有些不久之前的事情,倒仿佛发生在遥远的上古世
期刊