基于结构化信息和稀疏编码的图像分类研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:myazx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像的分类与识别是人工智能领域和计算机视觉领域中一个重要的研究课题,现阶段国内外关于图像分类与识别的研究正蓬勃发展,其中应用广泛的领域有:人脸检测、场景识别、光学字符识别、基于内容的图像检索、目标的监测、视觉定位、目标跟踪和视频去抖动等。然而由于图像中的物体一般情况下存在有遮挡、旋转、变形、对比度不一致等问题,如何有效地构建高效的图像描述子就越来越成为该领域内研究者们关注的重点,本文从图像的底层特征和结构化信息出发,提出了基于图像底层特征及其结构化信息和稀疏编码的图像描述子的构建方法,从而在线性SVM作为分类器的情况下达到对图像有效的分类与识别。在SIFT特征、Bandelet特征和稀疏编码的基础上,本论文就如何利用图像的底层特征构建高效的图像描述子做了大量的工作,主要涉及图像底层特征的提取、图像局部结构化信息和全局结构化信息的捕获方法、稀疏编码方法等等。本文主要工作如下:1)提出了一种基于SIFT特征和稀疏编码的级联空间最大化池的图像分类方法。即在SIFT特征的稀疏编码的基础上运用空间金字塔最大化池方法一层一层地构建图像的描述子。首先在SIFT特征的基础上运用空间最大化池方法,在整合并优化原始SIFT特征的同时,空间金字塔模型捕获了图像局部的结构化信息;其次对整幅图像块的稀疏编码再运用空间最大化池方法,即可以整合局部图像特征并且捕获图像全局的结构化信息,从而构建出图像的描述,再利用线性SVM训练学习并进行图像分类。2)提出了基于SIFT特征的级联匹配追踪的图像分类方法。即先提取出图像的SIFT特征,从局部小图像块的SIFT特征出发,利用级联匹配追踪一层一层地构建图像的描述,最后利用线性SVM训练学习并用于图像分类,该方法是一个基于SIFT特征的深度学习模型。3)提出了一种基于Bandelet特征的空间金字塔最大化池的图像分类方法。即利用Bandelet能较好地捕获图像中几何流的特性以及Bandelet变换系数的稀疏性,在Bandelet特征的基础上,利用几何流向信息与空间金字塔最大化池方法构建图像的描述子,从而用线性SVM训练学习并用于图像分类,该方法有效地降低了图像描述子的维数。
其他文献
工业作为国民经济发展的支柱,既是衡量一个国家综合发展水平的尺度,又直接影响着人们的日常生活。工业现代化水平越高,社会发展速度也越快,人们的物质生活会相对丰富、充实,
飞机燃油系统是飞机上的一个十分重要的系统,它的工作是由各个燃油附件控制和协调完成的。附件性能的好坏,直接关系到系统的安全可靠。因此,对燃油附件进行新件装机前校验、
船体外板的成形加工是船舶制造过程中非常复杂的工艺之一,现阶段国内外各船厂普遍采用的船板成型方法是水火弯板。本课题依托实际水火弯板智能控制系统研发的项目,重点对水火
无人机飞行控制系统作为飞行器关键系统之一,负责飞行器从起飞至降落的整个飞行过程。飞控系统软件具有安全性能要求高、功能繁多、复杂性高的特点,而传统的软件开发方式存在
电动自行车因为其节能、环保的特性逐渐被大众接受,作为电动自行车驱动电机的直流电机更是受到了广大制造厂商的欢迎,但是传统的有刷直流电机存在许多弊端使得零件和电动机寿
随着世界经济的飞速发展,全球的油气消耗量正以较快的速度不断增长,陆地资源供应日趋紧张。而海洋以其巨大的能源储存量吸引着世界各国的目光,然而随着近海资源的日趋减少,向深海
自从Reynolds首次提出经典的群体系统蜂拥模型后,不同领域的学者分别从各自角度探索了自然界的蜂拥现象所产生的原因及其可能的工程应用。近年来,随着复杂动态网络牵制控制研究
随着汽车保有量的增加,交通安全成为日益严峻的问题。疲劳驾驶会影响驾驶员的警觉能力、反应速度和安全驾驶能力,每年都会因疲劳驾驶导致大量交通事故。因此,对驾驶员的驾驶状态
在全球化经济飞速发展的今天,供应链系统的结构、环境都变得愈发复杂。虽然在国际化的市场和研究领域中对供应链风险管理的研究已逐渐形成比较成熟的体系,但是供应链仍无法完全
永磁同步电动机(permanent magnet synchronous motors, PMSM)具有体积小、噪声低、效率高、功率密度大等优点,随着电力电子技术和现代控制理论的迅速发展,PMSM得到了广泛的应用。直接转矩控制(direct torque control, DTC)以其控制结构简洁、转矩动态响应快、对电机参数依赖少等特点,已成为学术界研究的热点。本文在传统DTC理论的基础上,结合空