基于图理论的自动图像标注研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:lyfwgc2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动图像标注是基于内容图像检索中重要而具有挑战性的工作,它可以在一定程度上解决基于内容图像检索中存在的语义鸿沟问题。如果能实现自动图像标注,那么现有的图像检索问题实际上就可以转化成技术已相当成熟的的文本检索问题。因此,自动图像标注的研究是一个有重要意义的课题。  本文围绕基于图理论的自动图像标注展开研究,在分析现有的各种自动图像标注方法不足之处的基础上,提出使用基于图学习的自动图像标注方法。并阐明本文研究的立足点:使用基于图理论的自动图像标注作为传统的图像标注方法的补充,以提高图像标注系统的性能。  底层图像特征提取是自动图像标注系统的基础。本文详细阐述了基于自动图像标注的低层特征提取和图像分割方法,总结和归纳了各种方法的优缺点及适用范围。针对彩色图像存在边缘的模糊性,提出了一种基于模糊熵的图像边缘特征提取算法。该方法首先计算出每个像素在模糊熵特征空间的相异测度,结合邻域内的边缘结构,提取图像中每个像素的结构信息测度和方向信息测度,然后对结构信息测度和方向信息测度实施非极大抑制,确定最终的边缘像素图像。实验结果表明该方法边缘检测能力强,有较好的抗噪性。另外,为了改善JSEG分割算法对彩色图像存在过分割现象,提出了基于边缘信息的JSEG分割改进算法。  图像语义具有模糊性、复杂性、抽象性等特点,仅用低层特征进行描述是不够的,在提取图像语义时需要结合图像相关内容,以便提高图像标注的精确度。为此,本文提出了基于互K近邻图的图像标注方法,该方法用一个互K近邻图融合了图像的低层特征之间、标注词之间以及图像与标注词间的相互关系。利用互K近邻图实现从两个节点间相互的关系来提取语义信息,弥补了基于K近邻图的方法中单方向挖掘节点信息的不足。并引入逆向文档频率(IDF)修正图像节点与其标注词节点之间边的权值,克服了传统方法中高频词引起的偏差,有效的提高了图像标注的性能。在对互K近邻图结构分析的基础上,提出一种快速求解算法,该算法在不明显降低图像标注精度下,实现快速求解。  由于“语义鸿沟”的存在,低层特征相同或相似的图像,其语义有可能完全不同。如何挖掘图像的高层语义与低层特征之间的内在联系是当前图像标注领域研究的难点之一。本文在详细分析现有基于聚类的图像标注方法优缺点的基础上,提出了一种谱聚类图像标注方法。该方法采用以下两种有效途径建立图像的高层语义和低层特征之间的内在联系:首先利用多元统计学中的典型相关性分析(CCA)对图像的语义特征和低层特征进行关联分析,以便建立图像的低层特征与语义特征间的相关性。然后,在CCA空间内,对训练图像先按语义聚类,使得语义相同或相近的图像处于同一类中,再对每个语义类按区域特征聚类,通过这两次聚类能有效地建立图像的低层特征与语义特征间的一致性。实验结果表明所提出的方法明显提高了标注准确度。  前述的标注方法都存在需要大量的已标注图像的缺点,如何通过对少量典型的样本图像进行人工标注作为训练集,实现精确的图像自动标注,已成为当前图像标注领域中研究热点之一。本文在基于图的标签传播的原理与机制的基础上,提出一种利用Voronoi图的构图方法。该方法利用Voronoi图表达了空间目标的影响区域,将图像数据点在特征空间内的分布信息融合到点对间的相似性表示中。利用未标注图像与已标注图像的内在相关性,将半监督学习和多标记学习有效结合起来,为图像进行标注。实验结果表明,提出的标注方法效率高,同时标注结果与传统的标注方法相比得到了明显改善。  传统的标注算法的标注结果都不可避免地存在较大噪声,如标注词之间的不一致性,标注词无意义等现象。因此有必要对各类方法输出的结果进一步优化处理。针对这一问题本文提出一种基于随机点积图的图像标注优化方法。在优化过程中,度量语义相关性是必要步骤,为减少训练图集对度量的影响,本文采用随机点积图的方法对初始标注词构成的拓扑图进行点积随机化得到随机图,并获取对应的转移概率,从而挖掘出原先通过图像集没能得到的语义之间相互关系。结合随机游走算法,实现了对初始语义优化。实验结果表明所提出的方法比其他优化方法在标注准确度上有明显提高。
其他文献
当今世界处于信息爆炸式的增长并且迅速更新的时代,计算机和互联网技术的蓬勃发展对传统教育模式提出了巨大的挑战,催生了网络辅助教学平台的发展,但是同时具备下面优势的网
教务管理是高等学校教育管理过程中重要的组成部分,科学合理的管理流程不仅能提高教务管理人员的工作效率,而且能够提高整个高校教育管理的工作质量和效率。本论文以辽宁石油
随着无线通信和移动计算技术的发展,人们对无线宽带接入提出了更高的要求。无线网络能够实现高容量、高速率的Internet接入,是未来无线通信逐渐替代有线网络通信的先决条件,
伴随着计算机技术的不断发展,互联网日趋普及,网络上信息数量不断扩大,用户可以更自由的获取信息,这满足了用户的信息需求。但是随着网络上信息的大幅增长,用户在有限的时间
谓词加密算法是可搜索加密算法领域的研究热点,提供了外包数据的密文查询功能。谓词加密算法中假设外包方(例如云服务商)会正确地执行查询算法,并将真实的查询结果返回给用户
互联网上存在海量的网络资源,如何有效利用、开发这些资源是当前的一个研究热点问题。随着企业竞争越来越激烈,诸多业务要求在较短时间内汇聚网络上的网络资源以求解业务问题
信息化是当今社会发展的趋势,随着计算机、通讯技术与医疗影像科学在医疗行业的进一步应用,我国医院信息化管理进程得到不断深入和拓展。国内部分医院已经建立起了独立的医院
代码变形技术是软件保护技术的关键技术之一,属于针对逆向工程与加密技术互补的安全分支。代码变形技术按照类型分为词法变形、数据变形和控制流变形。本文主要研究了基于控
随着互联网的不断发展,在线数据库的数量不断增多,DeepWeb模式集成的重要科学研究意义和显著的工程应用价值就凸现出来,但是由于这些数据库在地理上分布、管理上自治、模式上
随着文本数据的急剧增长,文本聚类方法已成为大家关注的热点。文本数据常用文档-词矩阵表示,基于这种表示方法大多数传统的聚类算法采用单向聚类方法,即要么只是对文档进行聚