基于信息熵的图像检索技术研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:cau_hechun1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着各行各业对图像的使用越来越广泛,图像信息资源的管理和检索显得日益重要。基于内容的图像检索(CBIR)技术的研究主要包括两个方面:可视化特征提取和相似性度量。其中研究的主体是定义图像的可视化特征表示,通常可视化特征的表示可分为三个级别:图像级别、矢量级别和数字级别。现在大多数可视化特征的表示,诸如颜色、纹理、形状等,均是矢量级别的。因此,相似性度量空间是N维的,计算量相当巨大。 为了能够将可视化对象的级别聚集到最高级别,即数字级别,本文提出应用信息熵作为可视化特征的表示,即用图像的平均自信息量表示图像。这样相似性度量空间的维数就降到一维,从根本上提高检索的速度。本文采用的方法是用颜色直方图作为图像的概率密度函数的定义,再利用该密度函数推导出图像的信息熵。 基于信息熵作为可视化特征表示这一概念,本文提出了两种相似性度量方法:熵差分距离度量和最大相关熵度量。前者是简单的将图像信息熵进行相减,求得差的绝对值,所以计算速度相当快;后者是为了校正相关熵度量没有对称性的缺点而提出的,但此种方法并不能严格遵守可距离度量的条件,因此本文采用熵差分距离度量方法来对信息熵进行相似性度量。 对于两幅十分不相似的图像,其信息熵的值可能相等。所以,单独使用熵差分距离度量方法进行图像检索是不合适的,其精确度不高。为了保证检索算法速度既快,精确度又高,克服熵差分距离度量方法的缺点,本文提出了一个多步检索算法:EDLN算法。该算法先对图像数据库中的图像预先求出其信息熵;检索时,先用熵差分距离度量方法进行快速的粗略检索,得到一个新的图像数据库;最后使用颜色直方图L1-norm算法在这个新的图像数据库进行精确检索,得到最终结果。在EDLN算法的基础上,作者使用VC++6.0开发了一套国旗检索系统,来证明该算法的实用性。 本文的主要内容包括以下几个方面:八硕士学位论文 华吠还y MAs兀R’S TIffSIS l)提出将信息嫡作为图像的一种可视化特征表示,使图像可视化对象的级别山矢量级别聚集到数字级别,也就使相似性度量空间由N维降到一维。 2)提出了两种基于信息嫡的相似性度量方法:嫡差分距离度量和最大相关嫡度量。 3)提出了 EDLN多步检索算法,既保证了检索的速度,又保证了检索的精确度。在此算法基础之上,开发了一套国旗检索系统,提出该算法可以应用到诸如商标、IOgO标识等颜色特征十分显著的图像的检索中去。
其他文献
为了能完整的理解一个复杂的系统,就要对它建模,即从某个视点,在某种层次上详细说明被建模的系统。建模可看成一套在目标系统完成之前表达目标系统的技术,面向对象对于复杂软件系
本课题研究的重点在于对PKI中常用的密码学算法和安全协议的实现进行构件化,目标是使程序员在不需了解算法和协议细节的情况下能够使用本课题的研究成果进行安全应用的开发。
图像语义分割是计算机视觉领域中一个重要的研究主题,其旨在将图像自动分割成若干个含有一定语义信息的区域。准确的图像语义分割是实现诸多计算机视觉任务(如场景理解与分析)的
记录系统是与人们生活、工作关系密切的一种系统,随着科学技术特别是计算机技术的飞速发展,原来的记录系统己不能完全适应现在的生产需要,系统将向着网络化、数字化、多媒体、大
该文基于对系统分析与设计的理论研究,结合管理信息系统的特点,利用结构化分析和设计方法,重点阐述了某外贸企业合同管理模块的分析与设计过程.首先,该文讨论了管理信息系统
该文采用先进的视景仿真理论和计算机图形学技术,对分队战术训练模拟系统的视景仿真技术进行了深入的研究.在此基础之上,该文利用标准图形软件接口OpenGL和支持可视化编程的
自然语言处理已历时几十年了,热潮莫过于机器翻译。机器翻译的热潮过去后,语言处理逐渐进入平静、现实的务实阶段。近期人们将目标定在文本的自动分摘要、信息的自动检索和过滤
学位
分布式环境下RBAC的主要问题是如何在复杂的环境下高效、透明地实现用户-角色分配的逻辑全局性.给出了分布式环境下RBAC安全域的定义和构造,定义了安全域的偏序关系;在此基础
该文提出了一个基于异常的入侵检测系统—EAIDS,并实现了几种关于异常的检测算法.在EAIDS体系结构中采用了灵活的模块插件结构,具有秀强的可扩展性.目前系统支持两种类型插件