图像检索中的标注与排序方法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户：hebeikbyz

【摘要】

：

由于文本检索的巨大成功,目前主流的图像搜索引擎如Google、百度等对图像检索采用的还是基于文本关键词的方式,即根据图像周围的文本来判断一幅图像与查询的相关性。由于文本

【作者】

：

王刚

【机构】

：

山东大学

【出处】

：

山东大学

【发表日期】

：

2012年期

【关键词】

：

图像检索图像分类多示例学习图像排序随机游走集成学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

由于文本检索的巨大成功,目前主流的图像搜索引擎如Google、百度等对图像检索采用的还是基于文本关键词的方式,即根据图像周围的文本来判断一幅图像与查询的相关性。由于文本描述与图像内容之间可能存在的不匹配现象,图像检索结果往往不尽人意。改善图像搜索结果的方式一般有两种：一是检索前对图像进行语义标注,改善图像关键字的准确度,利用图像的语义进行检索；二是图像检索结果重新排序,就是对搜索结果利用图像和文本本身的特征,对搜索结果进行重新排序,试图将相关图像排在前面,以提高检索结果满意度。现实中图像内容往往具有多义性,传统的图像标注算法会导致准确率的下降。多示例学习是近年来才出现的一种新的学习框架,并以其对多义性对象的出色表示能力而被成功地运用在图像分类标注任务中。多示例学习中多示例包的生成方式是影响多示例学习效果的一个重要因素。本文将重点分析多示例图像分类标注,提出一个全新的图像多示例包生成方式。同时,为了提高分类的泛化能力,本文对集成学习也进行了相关研究。另一方面,图像本身又是一个多模态的对象,比如图像内容,图像相关文本,都是图像的不同模态。现在图像排序的研究对图像多模态特征之间的相互作用利用并不充分,本文通过分析现有的图像排序算法,全面的考虑图像多模态之间的相互关系,将提出一个将图像多模态统一起来进行排序的方法。本文主要做了三方面的研究：1)综合分析现有的基于多示例学习的图像标注算法,提出一个新的基于多示例学习的标注方法。方法中图像被建模成一个高斯混合模型,每个高斯模型作为多示例包中的一个示例。这样每个示例就是一个概率的表示,而非传统的向量形式,能更多的表示图像信息、。2)系统分析集成学习的现有研究成果,提出了一个基于多重集的新的选择性集成方法。方法是一个离散空间的优化问题,因此速度可以保证,同时,算法中分类器有各自的置信度。3)分析现有的图像排序算法的不足,提出一个新的图像排序算法,算法将更加全面的利用图像的多模态特征。算法将图像搜索结果集抽象成一个多重图。图的每个顶点是一副多模态图像,图像之间的多重边表示图像模态之间的相似度。最后利用随机游走模型来进行图像排序。为了验证所提算法的有效性,本文在Corel数据集、LCI数据集合Web Queries数据集上分别对三个算法进行了验证。实验结果证明,本文所提出的算法有效的改善了分类精度和排序效果。

其他文献

模型驱动的SaaS租户应用构建方法的研究

随着互联网的普及、软件应用技术和模式的快速发展,软件已呈网络化、平台化和服务化得发展趋势。其中,SaaS(Software as a Service)服务是一种新型的软件服务模式,凭借其按需

学位

SaaS模型驱动分层构建组件元数据

基于Gridsphere的蛋白质插入/缺失及其侧翼区域数据库的设计与实现

生物信息学是20世纪末随着生物技术的提高和生物学数据的积累而发展起来的一个新的领域,是一门利用计算机工具和技术对生物系统的问题和规律进行研究的学科。目前,生物信息学

学位

生物信息学蛋白质结构比对插入/缺失数据库

基于多重数字签名电子病历系统的责任认证体制

病历是对病人患病信息及医生诊疗和处理过程的记录,在就医过程中起到相当重要的作用。长期以来,传统病历均是纸质病历,存在易篡改、难保存等缺点。当今信息化已渗透各行各业,纸质病历也开始逐渐被电子病历(EMR)所取代。医院信息化建设是我国“十二五”期间工作重点之一,作为其核心的电子病历建设将是重中之重。电子病历集合了病人的各种信息,其安全性十分重要,因此建立一个安全可行的电子病历安全系统具体十分重要的意义

学位

EMRXKMS规则集XML数字签名多重数字签名

网络安全策略模型及冲突检测研究

基于策略的网络管理由于具有灵活、易用、自动化等特点,在网络安全管理领域得到了广泛的运用。策略是由网络管理员配置的约束规则集,用于保护系统安全。对当前网络安全策略模

学位

安全策略路径拓扑冲突检测决策树

图数据库频繁模式挖掘关键技术研究

从图数据库挖掘频繁模式在化学信息学、计算生物学、WEB信息管理、社会网络分析等领域有着广泛的应用。因此本文重点研究了从图数据库中挖掘频繁模式的关键技术，并针对频繁模

学位

数据挖掘频繁子图极大频繁子图代表性模式

基于深度学习的移动机器人视觉同步定位与地图构建中的环路闭合问题研究

同步定位与地图构建(SLAM)是移动机器人在未知环境下自主定位的关键技术,但由于其中跟踪算法的累计误差,机器人在长距离行驶后无法保证位姿的有效计算和地图的正确构建。环路

学位

基于视觉的同步定位与地图构建环路闭合探测卷积神经网络图像分割

基于Bootstrapping的领域知识自动抽取技术的研究

随着互联网的高速发展及其各种Web应用的快速增长,网络上的信息规模急剧扩大。网络已经成为人们生活中重要的知识库,人们对高效地获取信息的需求尤为迫切。在网络的海量数据

学位

领域知识抽取半结构化网站模式学习本体匹配Bootstrapping

提高无线Mesh网多播纠错机制效率的研究

随着无线技术的高速发展，各类有着严格时间与错误率限制的无线多播应用犹如雨后春笋。然而无线网固有的带宽不稳定、传输质量易受环境干扰等特点与多播应用的要求存在着极大的

学位

无线Mesh网原子性协议延迟冗余转发多播纠错

基于击键规律的隐私安全的研究

互联网的普及和信息技术的发展在很大的程度上方便了人们的生活,但与此同时,也提出了新的挑战。当用户在计算机上使用各种信息技术时,用户的个人信息和隐私的暴露已经成为一

学位

隐私击键规律识别

基于克隆选择算法的排序学习方法研究

信息检索是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。信息检索的核心问题之一是排序问题,即决定哪些信息是相关的、符合用户的习信息需

学位

克隆选择算法信息检索机器学习排序学习排序函数LETOR

图像检索中的标注与排序方法研究

其他学术论文