基于属性建模和知识学习的大规模图像检索

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户：huweiguangkaka

【摘要】

：

随着移动互联网和云存储技术的发展，以及移动媒体应用与社交网络的出现，近年来多媒体数据（文本、图像和视频等）呈现出指数级爆炸式增长的趋势。图像数据作为多媒体数据的一种重要

【作者】

：

傅建龙

【机构】

：

中国科学院大学

【出处】

：

中国科学院大学

【发表日期】

：

2015年期

【关键词】

：

大规模图像检索属性建模知识学习计算机视觉技术

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着移动互联网和云存储技术的发展，以及移动媒体应用与社交网络的出现，近年来多媒体数据（文本、图像和视频等）呈现出指数级爆炸式增长的趋势。图像数据作为多媒体数据的一种重要表现形式，具有表达能力强，信息丰富的特点，受到人们的广泛关注。然而，图像数据的迅速增长给传统人工管理和分析的方式带来了巨大的机遇和挑战，成为多媒体和计算机视觉领域的研究热点之一。　　本文以计算机视觉技术为基础，研究大规模图像检索的理论方法和实际应用。采用视觉码本学习，中层属性建模，语义概念学习等方法进行多层次的属性建模和知识学习，以此建立底层特征与高层语义之间的可靠关联，实现大规模图像检索。从底层特征到高层语义，一方面是对非结构化的图像数据进行量化分析，将海量的图像数据转化为丰富的底层视觉特征进行表达和存储;另一方面是建立底层视觉特征到高层语义的映射，建立索引并通过检索技术进行匹配和查询，从而为人们提供获取信息和管理数据的有效手段。　　本文主要研究内容和贡献如下:　　1.基于空间约束的商标图像建模与检索。针对单一底层视觉特征难以解决“语义鸿沟”的问题，本文引入不同种类特征间存在的空间关系对底层视觉特征进行约束，同时提出一种局部特征的动态融合技术，构建鲁棒的具有空间约束的特征描述子。依赖伪反馈技术，该方法能够自动地选择不同图像之间最具表达力的特征。实验表明该方法在商标图像的检索和识别任务中可有效地减少特征间的错误匹配，提高准确率。　　2.基于结构学习的图像中层属性表达和分类。针对人工定义的图像属性难以充分表达图像内容中存在的视觉特性，本文提出一种数据驱动的图像中层属性建模方法。该方法结合非监督的谱聚类和结构化约束的特征选择技术构建优化目标函数，自动地学习每一类图像中特有的视觉属性，形成有效的图像中层属性表达。实验表明以中层属性为基础构建的特征描述，可在图像分类任务中取得较高的准确率。　　3.基于结构属性的大规模服装商品检索。针对底层视觉特征缺少高层语义描述的问题，本文结合人体部件检测的最新研究进展，提出嵌入人体结构属性对底层特征进行有效约束，形成具有人体结构属性的视觉特征词组。依赖有效的高阶查询和具有结构约束的倒排索引，实验表明在大规模服装商品图像的检索任务中，该方法在有效地减少“语义鸿沟”提高检索准确率的同时，检索效率也得到提升。　　4.基于多视角知识学习的图像标注与检索。本文提出基于模型和无模型共存的多视角语义概念建模方法。该方法利用搜索引擎中的用户点击数据建立底层视觉特征和高层语义查询之间的隐性关联，对高层语义概念建立多视角的视觉知识库，并将视觉知识嵌入到标注模型。实验表明在标准数据库上，该方法取得的标注和检索性能均有显著提升。　　5.基于语义实体关系和知识传播的图像标注与检索。针对目前个人照片集缺少准确的语义描述集合和大规模训练数据的问题，本文提出通过知识学习的方法自动挖掘个人照片数据中的语义实体结构。借助已有的大规模网络训练图像，提出利用无监督的自动编码机在两个图像集合中学习共有的中层属性，并以实体关系作为高层语义知识先验对网络结构进行精调的深度学习训练框架。实验表明该方法可实现有效的跨领域的图像建模，标注和检索。

其他文献

LGCIMS下的统计研究

该文所论述的LGCIMS作为CIM先进哲理在涟源钢铁集团有限公司的一个具体实现,充分体现了其利用计算机通信信息集成实现现代化生产制造的内涵.它的应用工程主体框架由成本信息

学位

CIMCIMSORACLE数据库一级统计粗集理论PowerBuilder编程

跨模态数据分析与应用研究

随着互联网进入Web2.0时代，以微博、Flickr、Youtube等为代表的网站已逐渐成为新兴的各种数据产生和共享的平台。伴随而来的是文本、图像、视频和音频等信息的迅速膨胀。在网

学位

跨模态检索数据分析子空间学习法耦合特征选择哈希法

结构稀疏学习及其在图像检索中的应用研究

在数字信号处理和机器学习领域中，稀疏表示是一个基础且重要的研究问题，并在大量的实际应用中均表现出优异的性能。稀疏学习是一类基于稀疏表示的机器学习方法。经典的稀疏学习

学位

图像检索结构稀疏学习跨模态学习局部图像特征

SGⅡ升级装置主放CSF远场自动准直关键技术研究

能源是人类社会赖以生存和发展的基石。激光惯性约束核聚变(ICF)技术实现了核聚变过程的可控性，该过程释放出来的巨大能量可以为人类所利用。目前，新一代高功率固体激光驱动器

学位

惯性约束聚变激光准直系统光路结构图像处理控制系统

基于DSP的管道水感应加热关键技术的研究

管道水感应加热是利用电涡流对管壁及流水进行加热的一种技术，由于具有效率高、清洁等优点而在工业生产中得到广泛应用。随着微电子与数字信号处理技术的发展，感应加热技术正朝

学位

工业生产管道水感应加热数字信号处理

高炉密闭冷却系统声谱检漏研究

该文结合高炉的实际工况条件,在大量查阅国内外相关技术文献资料的基础上,给出了基于DSP的冷却系统泄漏声谱检测的系统设计方案.该系统以TMS320C50为核心,通过对现场噪声进行

学位

高炉冷却系统泄漏声谱检漏数字信号处理DSP系统

自适应预测控制理论与应用研究

该文就是针对这种情况将预测控制与自适应控制相结合,发展了自适应预测控制, 使它同时具有预测控制和自适应控制的优点.在这种控制算法的实施中并不涉及现代控制理论中常用的

学位

自适应预测控制统一自适应预测控制智能调节器

微机控制汽车交流发电机性能测试系统及其模糊控制研究与应用

该文介绍微机控制的汽车交流发电机性能测试系统的设计方法和设计技术,主讨论了系统的结构、功能以及软硬件的设计方法.首先介绍汽车交流发电机的工作原理和性能测试方法,然

学位

汽车交流发电机性能测试微机控制模糊控制

我国农药业管理与发展的研究

该文从中国农药业目前发展和管理现状出发,通过与发达国家对比的方法,以现代经济理论为依据,系统地分析了农药业系统各要素的问题,提出了农药业改革与发展的思路.

学位

农药业农药业管理交易费用理论企业创新规模化

论高技术条件下军队战斗力的构成、发展与运用

该文应用系统的观点,把军队看作一个大系统,分别从军队战斗力的物质系统,能量系统和信息系统的角度,分析构成军队战斗力的客观因素,得出人是战斗力物质力量的主体,是战争中一

学位

物质系统能量系统信息系统高技术军队建设战斗力

基于属性建模和知识学习的大规模图像检索

与本文相关的学术论文