基于LDA的图像区域标注模型的研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:cheng1129
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术、图像技术以及多媒体技术的发展,各类数字图像处理技术的应用越来越广泛。海量的数据集要求用户用一种符合人类感知认知机理的、基于语义概念的图像检索系统来对图像进行有效的管理与组织。构造一个基于语义的图像检索系统,图像的语义标注是关键的步骤,这将跨越底层视觉特征和高层语义之间“语义鸿沟”,因此图像语义区域标注成为研究的热点。图像语义标注中存在图像区域视觉特征相似而类别却不相同的多义性问题,传统的标注方法直接利用区域视觉特征进行分类,无法解决这种多义性问题。很多学者直接借用文本处理中的主题模型来处理多义性问题,但这些方法存在以下几点问题:对于两类图像标注问题,忽略了图像原始视觉特征,仅仅使用了生成的主题特征,这将影响标注精度;对于多类标注问题,这些方法不具有直接输入多种特征的能力而输入单一特征或者拼接特征,这样将会因为不能充分利用图像信息或高维问题而无法获得理想的标注效果。针对以上问题,本文基于LDA模型,对图像语义区域标注模型进行研究,主要工作和成果如下:1、针对两类标注问题使用主题模型中忽略原始特征的问题,提出一种基于有监督的图像标注模型LDC。该模型以有监督的方式训练获得图像主题特征,同时系统、理论地结合图像区域主题特征、原始视觉特征及区域类别进行标注,可以获得更好的标注效果。2、针对LDC模型迭代过程有嵌套迭代,用在规模较大的数据集上时间开销过大的问题,提出一种基于样本加权的标注算法LDA-C。该算法利用LDA模型生成主题特征,利用LDC模型中样本加权的分类思想获得图像区域类别,以牺牲少量标注精度获得时间开销上的优势。3、针对多类标注问题使用主题模型无法输入多种特征的问题,提出一种基于多特征的Multi-cue s-LDA模型。该模型能直接输入多种特征,不同类型特征分别量化获得词汇表,相对以往的特征拼接做法,可以在控制词汇表容量的同时获得较高的量化精度,在多类的图像区域标注问题上获得了很好的效果。
其他文献
该文将对分布式地理信息系统环境和Agent技术进行研究和探讨,分析其中的关键技 术,主要包括系统的结构,数据模型,多Agent的协作机制,Agent之间的对话语言等;并且结合分布式地
该文首先根据目前流行的两大主要构件模型ActiveX和JavaBean模型的主要特点,提出了应该在商业企业中建立行业级构件库的想法,然后探讨了以这种行业级构件库为底层依托的基于
这篇论文主要讨论了使用集成工具DELPHI如何开发数据库应用程序的方法和技术.在这篇文章中讲述了数据库系统及应用程序的发展过程.简要的介绍了软件开发所遵循的工程模式如瀑
该文系统介绍了数据仓库区别于传统数据库的特点、国内外发展动态、体系结构、设计方法和步骤以及数据仓库在线分析(OLAP)工具产品.接着该文介绍了决策支持系统(DSS)发展的理
该文研究机群机间的高速通讯系统.详细地给出了其中两种数据链路:单链路缓冲机制和基于Wormhole机制的二维Mesh网络.文中详细分析了它们的带宽、延时性能与数据流量和数据缓
该文首先介绍了Internet的发菜状况,鉴于Internet是一个庞大、杂乱、瞬息万变的信息海洋,仅仅依靠网页上的超文本链用户是无法方便、快捷地找到自己所需的信息的,为WWW信息提
该文首先介绍了HPF语言的特点,并介绍了p_HPF的编译模型:通过源到源的编译变换,将HPF源程序变换为一种以FORTRAN77为目标语言的结点程序,该程序是基于消息传递的SPMD程序.同
该文在系统地分析网络信息安全理论及其实现技术的基础上,研究提出一种以离散对数和因子分解问题与杂凑函数技术为理论基础的高强度的公钥密码体制的签名方案,并提出适合smar
在现代生物工程、信号处理、图像处理、信息检索中,生成的数据量越来越大,但是由于计算机的存储量和运算速度的限制,很多时候没有办法对这些数据直接进行应用,所以通常要对这些生
该文介绍了数组相关分析技术在数据并行语言HPF译器中的需求和应用.HPF语言是对FORTRAN语言的扩展,增加了数据分布指导语句和并行语言成分.除了对传统的串行语言成 分进行分