论文部分内容阅读
近年来,随着多媒体技术和计算机网络的飞速发展,全世界的数字图像、音视频、数字动画的容量正以惊人的速度增长。无论是军用还是民用设备,每天都会产生很大容量的数字媒体。这些数字媒体中包含了大量有用的信息。然而,由于这些媒体是无序地分布在世界各地,因此其中包含的信息无法被有效地访问和利用。这就要求有一种能够快速而且准确地查找访问媒体的技术,也就是所谓的媒体检索技术。基于内容的媒体数据检索技术是当今的一个研究热点,国内外的许多研究机构都在从事这一课题的研究,并取得了一定的研究成果。现在可以检索的媒体类型包括动画、音频、视频、静态图像等。MPEG-7是运动图像专家组推出的基于内容的多媒体描述标准。MPEG-7标准重点在于数字AV(Audio-Video)信息的描述和定义,它以明确的结构和语法来定义AV信息的内容,对AV信息进行标准化描述,并将该描述与所描述的内容相联系,以实现快速有效的搜索。目前,用于检索的图像特征主要有颜色(Color)、纹理(Texture)、形状(Shape)等。由于不同的应用背景,不同的基于内容检索系统在其检索实现中采用的技术也各有侧重,基于内容的图像检索可以说是图像处理和计算机视觉各种技术应用的综合。本文在广泛查阅国内外有关基于内容的图像检索技术资料的基础上,基于MPEG-7标准,在图像检索技术,图像特征信息提取、存储、检索等方面进行了深入的分析和研究,实现了关键算法,并搭建了基于内容分析的图像检索系统,能够对图像的颜色、纹理、形状特征进行提取并实现检索应用。论文主要工作包括:1.研究主流的基于内容的图像检索技术,分析研究方向及未来的发展趋势,确定论文所要采用的图像数据存储方式、检索方式等。2.详细分析了MPEG-7标准的各个组成部分以及其核心—XML技术,并在此基础上探讨了MPEG-7在基于内容的图像检索系统中的应用。3.图像特征提取是图像检索中的关键,本文集中分析了颜色、形状、纹理方面的特征描述符,在此基础上进一步分析了各种视觉特征的提取方式。4.为了实现图像检索,必须对提取图像的不变性特征进行匹配。形状不变矩是目标的一种物理特征,它对于物体的平移、旋转、比例变换具有不变性,故系统实现中提取了图像的形状不变矩特征,采用欧氏距离计算相似度对图像进行匹配,以提高图像匹配效果。5.对图像检索系统的总体架构、实现功能、系统模块的代码设计方案以及系统实现中的关键问题进行了详细讨论。特别是关于对视频片断的处理,将其灵活解码为中间帧,然后按照静态图像的方式处理。6.基于上述理论方法,采用安全性较高的SQL Server数据库作后台数据库,给出了特征数据基于XML文件和基于数据库的双重存储模式,并且分析了它们之间的同步问题。