图像内容表示及多标签标注算法研究

来源 :华东理工大学 | 被引量 : 0次 | 上传用户:zdman
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数字媒体技术和计算机网络的不断发展,数字图像资源迅猛增加,如何有效地管理与检索如此巨大的资源,就成为学术界亟待解决的问题。从20世纪90年代初起,基于内容的图像检索技术(CBIR)逐步取代原来的基于文本的图像检索技术(TBIR),成为多媒体技术研究的热点之一。但图像低层特征和高层语义之间的“语义鸿沟”严重限制了CBIR的发展,因此研究人员逐渐将关注回归到语义,使得以图像自动标注为基础的基于语义的图像检索技术(SBIR)越来越受到重视。本文在深入理解和分析图像语义检索最新研究进展的基础上,创新地提出了用于图像内容表示的RoI-BoW模型,以及基于多层分割内容表示的图像多标签自动标注模型(MLSIA)。RoI-BoW模型在BoW模型的基础上进行了改进,该模型考虑到兴趣区域对于图像检索的重要性,通过关键点的检测与过滤生成兴趣区域,并采用不同的方式对兴趣区域和非兴趣区域分别进行图像内容表示,最后将两个部分按照一定的比例相结合,成为最终的图像内容表示。本文利用基于RoI-BoW模型的图像内容表示方法对图像进行检索,并与基于BoW模型的图像内容表示方法进行了检索性能的对比,实验结果证明基于RoI-BoW模型的图像检索算法能够得到更加准确的图像检索结果。基于多层分割内容表示的图像多标签自动标注模型(MLSIA),其创新点在于采用多层分割图像内容表示方法,以及利用二阶条件随机场对图像进行自动标注。MLSIA首先采用多层分割图像内容表示方法,将显著性分析与多种分割算法相结合,对图像进行多层次的分割,并利用基于区域的“词袋”模型进行图像内容表示;接下来,MLSIA将图像内容的表示和图像的语义标签相结合,训练二阶条件随机场模型,并运用该模型对图像进行多标签自动标注。本文利用MLSIA对三个不同图像数据集进行了图像多标签标注的实验,并与其他标注模型进行了对比,实验结果证明,MLSIA在图像多标签标注上能够得到较好的查全率和准确率,且优于同类算法。
其他文献
该文从三个方面探讨了可视化的并行程序设计方法:①研究了可视语言在并行程序设计中的应用,提出了一个可视化的并行软件开发模型--层次抽象网络(Hierarchy and Abstract Nets
近年来,由于目标追踪、车辆定位、线路导航等基于位置的服务(LocationBased Service,LBS)的应用需求迅速增长,使得位置感知和定位成为相关领域的热点研究问题。场景分析法是目前
该文将信息熵、遗传算法、最优试验理论、神经网络方法及Kriging模型理论等结合在一起,着重解决“面向计算机模拟的数据采集及试验设计技术”的有关理论及应用问题,因此是一
WWW浏览中的预取技术已经被证明在减少浏览延迟方面相当有效,在该文中首先介绍了几种通常采用的预取算法,并对它们的预测效果进行了比较.在文中研究者提出了一种预取控制方法
核事故应急决策涉及面广泛,是一个典型的风险型、非结构化、多属性的复杂系统决策问题。在具有一般的多属性决策问题共同的特点之外,它还具有政治敏感性。社会敏感性和一定程度
中小型印刷厂管理信息系统(MPMIS)是当前MIS系统的主要应用领域之一。一个企业、一个工厂建立管理信息系统对企业的生产、管理等有着极其重要的意义,它可以提高企业的管理水平,使
该文从Web当前所面临的问题和解决这些问题的方案入手,分析了作为重要解决方案 之一的Web缓存的分类和组织结构,揭示Web请求流的时间局部性特征,说明了Web客户的请 求所符合
该文的主要工作是建立基于MPLS的流量工程模型,MPLS作为下一代网络的主要技术,在很多方面表现出了优异的特性.流量工程的概念来源于通过对网络资源和流量的综合管理,优化网络
随着计算机和通信网络复杂性不断增加,要求采用复杂的网络管理技术。目前,大多数网络管理系统采用集中式管理模式。这各管理模式具有较低的灵活性、重构功能和占用网络大量的
该文在详细分析钻井生产管理与现场指导调度网络信息系统的基础上,对系统的研究与开发进行了论述.根据用户的需求,系统采用了客户/服务器体系结构,客户端使用PB6.0作为工具,