基于嵌入结构性信息视觉特征的图像理解模型研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:xyw1h
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的发展和移动互联网的兴起,大量的多媒体信息特别是图像被上传到互联网上并且数目仍在不断的增加,这些信息将人们带入了图片大数据时代。为了挖掘海量图像数据中的有效信息及其中所蕴含的经济和社会价值,涉及到与图像相关的诸多技术,图像理解是其中较重要的一环。传统的用于图像理解的方法主要是基于词袋模型,即首先提取图像的底层特征表示,然后构建一个编码词典,最后将图像底层特征依据编码词典进行映射得到图像的直方图特征表示。虽然该方法广泛应用于图像理解的相关方向如图像中的物体识别和图像检索,并取得了一定的效果,但是基于词袋模型的表示方法会将图像中蕴含的结构信息丢失,导致图像特征表示的辨别性和鲁棒性存在一定的局限性。区别于基于词袋模型的图像特征表示方法,本论文提出了一种新的构建图像特征表示的方法,该方法将与图像相关的结构信息融合到图像的特征表示中,以此来提高图像特征表示的辨别性和鲁棒性。本论文提出了三种不同形式的结构信息的嵌入视觉特征表示方法,并将其分别应用于图像理解领域中的图像检索,图像分类和图像语义标注中。第一种方法是在基于轮廓图像的图像检索和分类的应用中,不同于传统的方法直接提取轮廓图像的特征点并构建特征描述符,在本论文中,提出了将轮廓图像所描述的物体的本身所具有的结构对称性嵌入到图像的视觉特征表示中,从而构建出包含物体对称结构的图像视觉特征表示。该特征表示能够有效的提高特征描述符的辨别性和鲁棒性。在实验中,将该嵌入对称结构的视觉特征表示应用于轮廓图像的分类和检索上,实验结果表明该方法能够有效的提高轮廓图像的检索和分类的准确度证明了结构信息嵌入特征表示中的有效性。第二种方法是在基于视觉属性的图像检索的应用中,不同于传统的方法仅考虑视觉属性查询词与其他相关视觉属性之间的共存性,在本论文提出的方法中,首先将视觉属性结构之间的互斥和共存性嵌入到视觉属性的特征表达之中。然后利用该嵌入结构信息的图像特征表示,提出了一种基于特征重建的图像检索框架,该框架能够有效的保留图像的结构特征从而能够有效的提高图像检索的稳定性和鲁棒性。实验结果证明该方法能够有效的降低查询关键词的歧义性,提高图像检索的准确度。第三种方法是在基于弱监督的图像标注的应用中,由于图像中包含有多个物体,因此传统的基于词袋的特征表示方法具有歧义性,进而无法表示图像中不同物体之间的结构关系,最后使得图像标注结果的不准确。本论文提出一种将语义标签的结构相关性信息嵌入到图像特征表示之中的方法,从而克服原始特征表示存在的歧义性。实验结果表明该嵌入语义标签的结构性特征表示能够有效的提高图像特征表示的辨别性和泛化能力,进行能够推动图像标注的查全性和准确率的提升。本论文为了验证视觉特征的结构性在图像理解中的作用,考虑到不同的应用场景下图像特征中嵌入不同层次的结构性信息:底层信息中的物体本身的对称结构,中层特征信息中的视觉属性的相关性结构以及高层物体标签信息之间的语义结构。通过不同的实验结果证明本文所提出的嵌入结构性信息的视觉特征表示能够有效的提高特征表示的辨别性和鲁棒性,同时实验结果也表明了嵌入结构性信息的视觉特征的有效性以及能够对计算机视觉中图像理解方向的发展具有一定的推动作用。
其他文献
农村最低生活保障制度属于公共产品,低保金的发放是其核心问题。通过分析农村最低生活保障制度的财政支付现状,发现存在资金投入不足、对象核定难、标准偏低、监督不到位等问
一、三种养老保险模式的简要评析当前,世界各国的养老保险模式虽然各式各样,但从养老保险资金筹集和支付的财务角度划分,大致可以分为三种模式:现收现付制、完全积累制、部分
钦州供电局于1994年12月12日正式成立。全局共设有13个职能部室、8个专业管理所(中心)以及1个供电分局,有员工832人,管辖钦州城郊、灵山、浦北供电公司3个县级供电企业。2015
北部湾开放开发引来了新一轮的投资热潮,但北部湾的金融发展相对滞后,缺乏强有力的金融支撑,迫切呼唤加强金融合作,以解决开放开发的资金难题。台湾地区金融业发达,资金充足,
[摘 要] 本文通过我国西部地区循环经济发展的现状和对发展循环经济过程中的制约因素进行分析,提出了西部地区加快发展循环经济的对策和建议。希望能对西部地区循环经济的发展提供一些参考价值。  [关键词] 西部地区 循环经济 思考    一 、循环经济在西部地区的实践  近年来,中国政府将发展循环经济、建设生态工业园区作为实现区域可持续发展、建立资源节约型和环境友好型社会的一个重要举措,国家环保总局及有
财政部颁布了新的企业会计准则,此准则的制定旨在规范企业为获取职工提供服务而给予各种形式的报酬,以及其他相关支出的会计处理和信息披露。本文从职工薪酬与以往相比的区别和
教学内容:人教版九年制义务教育课程标准实验教科书数学六年级下册10~12页课前准备:用教材第121页的材料做一个圆柱。片段一:师:课前老师安排大家用教材121页的材料做一个圆柱,做得
目的探讨血清Ⅰ型前胶原氨基端前肽(PINP)和β-胶原降解产物(β-CTX)的测定在预测骨质疏松性骨折中的价值。方法 110例骨质疏松患者分为骨质疏松组和骨质疏松伴骨折组。另选
限容量弧路径问题是一个经典的组合优化问题。它可以归结为在一个给定的连通图上寻找经过图中某些边并满足特定约束条件的最优回路集。限容量弧路径问题在现实生活中有着极为