基于空间上下文的场景理解方法研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:fano
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
场景理解是计算机研究领域的主要难点和热点,其根本目标就是让计算机如同人的大脑能正确理解自然场景以及其中的内容,计算机视觉和人工智能的发展促进了图像理解研究的大幅度进步,这三者有着密切的联系。经过几十年的研究,图像理解技术有了长足的发展,但仍存在很有挑战的问题,例如场景中物体的标签种类数量庞大;另外自然场景中海洋、天空、陆地、建筑、树木等占据了场景中大部分空间,人物、车辆、树木等则处于了极少部分的一端,而往往是这部分物体表达了关键的语义信息,这就使得场景的语义理解受到很大阻碍。对于场景理解而言,充分利用全局的上下文信息尤为重要,很多现有模型或方法对上下文信息的建模只局限于较小范围,只能学习局部特征。针对局部上下文的局限性等问题,本文提出一种基于空间上下文的场景理解(Image parsing with spatial context,PSC)算法。该算法通过抽取位置特征向量学习了空间关系,形成空间关系字典以描述物体间位置关系以及共现性等信息,将其融入马尔可夫随机场作为方向约束补充全局的空间上下文信息。在上下文信息表达方面,对图像进行不同尺度的分割,在超像素上提取特征。PSC算法在MSRC和SIFT Flow数据集上进行了实验,通过与较为前沿的算法相比较,PSC算法在物体类别标记精度上占有绝对优势,像素标记精度也高于绝大多数其他算法。综上,本文提出基于空间上下文的场景理解算法,从语义、空间上下文信息的角度把握全局信息,利用高级语义特征对场景内容进行描述,对场景理解的研究有着重要意义。在具挑战性数据集上的实验结果表明就准确性和鲁棒性而言,提出的算法优于最新水平的算法。
其他文献
本文研究如下一维Thin film方程ht+(hhxxx)x+(h3hx)x=0,x∈(-L,L),t>0, h(x,0)=ho(x),x∈(-L,L),其中初始函数满足h0(x)≥0,h0(x)∈L1(-L,L)∩H1(-L,L).这里未知函数h(x,t)表
人类活动的影响和水环境的剧烈变化可能导致了水体中枝角类的遗传多样性发生变化。蚤状溞(Daphnia pulex)和拟同形溞(Daphnia similoides)分布范围广,常被作为模式生物。本研
量子纠缠是量子信息与量子计算研究中的重要方法。量子传送、量子密集编码、量子密码等一些经典物理中无法解决的问题可以通过量子纠缠的研究得到答案。量子纠缠与量子纠缠动
运用置换群理论来研究图的结构是代数图论的一个重要的方法,而图的对称性是代数图论的一个重要研究课题.图的对称性主要是通过图的全自同构群在图的各种子图上的作用来描述,
循环码是具有很好代数结构和性质的一类特殊线性码,它被广泛的应用到数据储存,量子码构造和调频序列构造等多个领域.循环码的重量分布不仅刻画了码的纠错能力,而且可以用来计
科学管理库存是当今社会发展关注的焦点,因此库存控制理论成为运筹学研究的重要分支。传统的库存控制模型通常视单位时间单位物品的库存费与短缺费为常数,然而在实际中,库存
海洋环境中分离出的Microbulbifer sp.A4B-17菌株能够利用糖类等可再生资源合成对羟基苯甲酸(4-hydroxybenzoic acid,4HBA)及其酯类物质。对羟基苯甲酸是一种用途广泛的工业
信息时代的脚步声越来越近,复杂网络学科的引入为更加深入地研究复杂系统的结构特征与其上的动力学行为提供了详细的理论基础和方法。本论文涉及的研究工作主要与复杂网络系
图的独立多项式是代数图论研究中的一个重要组成部分,对其单峰型性质的研究是代数图论中的一个热点问题.1987年,Erd?os等人猜想任意一棵树或者森林的独立多项式都是单峰的.这
有限差分法、有限元方法和谱方法是求解偏微分方程的三种主要方法.谱方法是以整体光滑的正交多项式作为基底逼近问题的解,其优点是高精度,也就是说,只要问题的解越光滑,逼近