优化空间金字塔匹配模型的图像分类研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:xiaomei52689
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着经济和互联网的快速发展,数码相机、智能手机等移动设备已进入千家万户,人们在生活中无处不使用到数字多媒体设备。无论是在学习、工作中,还是旅游、逛街等生活中的方方面面,我们都会通过移动设备以视频或者图像的形式来分享和记录自己日常的点点滴滴。因此,在网络中构成一个庞大的图像库。那么如何从这个庞大的图像库中搜索和利用自己想要的图像成为人们关注的焦点。为了使计算机能够更好地管理和组织这些图像,前提是能够让计算机对图像的内容进行分析和理解。图像分类是解决图像理解问题的重要途径,在图像检索技术的发展过程中起着至关重要的作用。目前,基于视觉词袋模型和支持向量机的图像分类技术已经成为图像分类的主流技术。在视觉词袋模型中,针对利用图像局部特征构造视觉词直方图中没有考虑图像.局部特征的空间信息问题。本文通过使用空间金字塔匹配模型来引入图像特征的空间位置信息。在空间金字塔匹配模型的基础之上,对视觉词袋模型中存在的缺陷提出了以下改进办法:(1)在视觉词袋模型中,针对k-means聚类构造视觉词典存在的缺陷,第三章提出了双词袋模型来构造更具有表征图像能力的视觉词直方图。它能够减少由于k-means算法的不稳定性和过于依赖初始聚类簇中心的选择给实验结果带来的干扰。采用双词袋模型构造视觉词直方图时,对于那些处于聚类边界中不稳定的视觉词和十分稳定的视觉词赋予不同的权重值,从而在空间金字塔匹配模型中得到更具有表征能力的视觉词直方图。通过支持向量机进行分类试验表明了该方法的可行性。(2)针对视觉词袋模型存在的不足:1、k-means算法的不稳定性和过于依赖初始聚类簇中心的选择给实验结果带来的干扰;2、没有考虑图像中不同区域的视觉显著性。第四章提出了一种基于视觉注意机制和空间金字塔匹配的图像分类方法。首先采用更加优异的模拟退火遗传的模糊C-均值聚类算法来构造视觉词典;然后将人类的视觉注意机制引入到空间金字塔匹配模型中,因为在现实生活中,图像的不同区域对于人眼的视觉冲击效果是不一样的;最后通过视觉注意机制构造加权的视觉词直方图。通过支持向量机分类表明,该方法更加符合人的视觉效果来对图像进行类别判断。
其他文献
宽带光纤无线(ROF, Radio over Fiber)技术利用光纤链路传输高频率无线信号,融合了光纤通信的高容量、低损耗和无线通信的高效灵活性等优势,受到了广泛的研究。同时正交频分复用(O
传统节日作为非物质文化遗产的重要部分,是人类非常宝贵的精神文化财富。随着社会节奏的不断加快,在全球化和现代化进程中,传统节日习俗在保护和传承中遇到了许多的问题,保护
民航的快速发展对经济和社会发展发挥着巨大的推动作用,但是航空器噪声污染问题严重影响民航的可持续发展。物联网技术的应用与发展为机场噪声细粒度的监测提供了可能。随着民
近年来,三维场景重建的研究越来越得到重视,使得三维数字地图等技术获得了蓬勃发展。三维场景重建是当今计算机视觉研究中备受关注的研究方向。随着深度相机的普及,基于深度
面向服务架构因其松耦合、资源共享等特性可以很好的适应分布式,跨平台等要求,迅速在各个领域发展并实际应用起来。但是面向服务架构中的安全问题一直是阻碍其发展的重大问题,随
随着计算机软硬件技术和互联网的发展和普及,影视动画、游戏动漫、生物医学等3D产品的消费和使用,已成为普通大众生活和工作的一部分,立体取代平面、虚拟模拟现实的3D技术带领我
在维护过程中可以通过实施度量来收集、分析相关属性数据,规划当前的项目,增加项目控制的可视化程度;通过维护度量帮助人们认识和理解软件维护活动,定量的评价软件维护过程本
随着社会化媒体的兴起,人们可以更频繁更便捷的与互联网互动,互联网的资源呈现爆炸式增长。丰富的互联网资源带给人们便捷的社交资源的同时也给人们带来信息冗余的困扰,为了解决
访问控制技术是信息安全技术的重要组成部分,其中基于角色的访问控制技术RBAC是当前研究的热点。然而随着RBAC管理角色间关系复杂化,导致难以对管理角色的辖域做出准确判断。为
虚拟化技术集群环境中逐渐在得到大量应用,是当前云计算技术飞速发展的重要的基础性工作。围绕虚拟化集群系统的性能问题,本文从性能测量、性能优化两个角度讨论了虚拟化集群管