论文部分内容阅读
随着存储设备、计算机网络和压缩技术的发展,视觉信息大量涌现,如何有效地组织、表达、管理和检索浩如烟海的视觉信息,已成为科研领域和工业界亟待研究解决的问题.其中,视觉信息语义标注受到愈来愈多的关注,成为当下的研究热点。早期的视觉信息标注是人工完成的,然而人工标注费时费力,无法完成大规模视觉信息的语义标注,这促使人们寻找新的标注技术。由于机器学习方法具有成熟的理论基础,可为语义标注提供理论支持及可能的解决方案,基于机器学习的自动语义标注已逐渐成为解决视觉信息标注问题的主流途径.本文主要针对基于机器学习的视觉信息标注展开研究,提出了一系列新颖的标注算法,期望通过挖掘视觉信息标注的特性来提高视觉信息标注的准确性,以促进其实用化进程。本论文的主要研究工作如下:1.提出了面向语义概念特性挖掘的视觉信息标注框架。在传统的视频标注方法中引入语义概念特性挖掘,提出了结合概念间统计相关性以及语义相关性的视觉信息标注改善算法。传统的视觉信息标注方法将某语义概念的标注问题当作两类分类问题来解决,将语义概念简单地视为类别标号,忽略了语义概念的自身特性,如概念间的统计相关性、语义相关性等,从而难以获得令人满意的效果。本文通过挖掘语义概念特性,并以此指导视觉信息标注,有效地提高了标注的准确性。2.提出了全新的基于半监督多语义概念学习的视觉信息标注技术。将多语义概念学习引入到半监督学习中,提出了半监督多语义概念学习框架。基于此框架,提出了两种新颖的半监督多语义概念学习算法,有机地结合了样本间的相似性、语义概念间的相关性、以及样本与概念间的映射关系。基于半监督多语义概念学习的视觉信息标注技术在克服了训练样本缺乏问题的同时,充分挖掘了概念间的相关性,获得了更为准确的标注模型。3.首创性地研究了基于多示例多语义概念学习的视觉信息标注技术.多示例学习作为消除数据歧义性的有效途径,己被越来越多地应用于视觉信息标注。但是,以往的多示例学习方法局限于解决单语义概念学习问题.而视觉信息标注本质上是一个多语义概念学习问题,并且数据歧义的起因也正是这种多语义性。多示例多语义概念学习技术从全新的角度对视觉信息标注进行研究,将多语义概念学习的思想引入到多示例学习中,通过挖掘概念间的相互联系更好地消除了视觉数据的歧义,从而有效地提高了标注的准确性。视觉信息标注研究,涉及到机器学习、计算机视觉以及认知科学等多个领域,希望本文的研究工作,也能为相关领域提供一些新的思路与方法。