图像特征的判别与紧凑表达方法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户：loserlu

【摘要】

：

图像特征表示是计算机视觉和模式识别领域重要的研究方向。图像特征表示对图像识别与检索具有重要的影响。目前大多数浅层的图像识别与检索算法直接利用提取好的特征来进行识

【作者】

：

柳吉

【出处】

：

重庆大学

【发表日期】

：

2004年期

【关键词】

：

图像判别特征表示图像紧凑特征表示特征级联迁移哈希机器学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

图像特征表示是计算机视觉和模式识别领域重要的研究方向。图像特征表示对图像识别与检索具有重要的影响。目前大多数浅层的图像识别与检索算法直接利用提取好的特征来进行识别与检索,然而它们存在明显的不足与限制。基于稀疏表示的图像分类算法以及核范数矩阵回归分类算法每一类训练样本的重构残差具有判别性,可以利用来表示一张图像。此外,基于哈希学习的图像检索算法也同样没有充分利用已学习到的二进制紧凑特征。深度学习作为一个多层次的特征学习方法可以学习到强有力的判别图像特征,因此在图像识别与检索方面取得了非常好的效果。然而,深度学习依赖于大数据、高性能计算设备以及回传的优化方式去训练大量的参数。显然,在小规模数据集上训练深度神经网络难以实现期望的效果。基于上述问题,本文提出了适用于小数据集的深层模型框架,用于图像特征的判别与紧凑表示。与此同时,由于数据稀疏问题,即感兴趣域中数据量不足难以学习到有效的特征哈希函数,借助于迁移学习的思想,本文又提出了一种最优投影指导的迁移哈希模型,用于异构图像的紧凑表示和图像检。本文内容如下。(1)基于深度级联的人脸识别模型。该模型利用基于稀疏表示的图像分类算法以及核范数矩阵回归分类算法计算误差向量,利用图像金字塔结构,将误差向量进行级联。该算法继承了深度学习的优点,也就是分层学习、特征非线性转换、多层连接。该算法主要的贡献有四点:1)提出了的端到端的没有反向回传的深度级联模型,它更适用于小规模数据集;2)采用多层金字塔结构进行局部图像表示;3)为了在分层学习中引入非线性转换,该算法提出带有判别性的误差软最大值函数向量来表示图像;4)已有的表示学习方法可以很容易整合到本文提出的基于深度级联的人脸识别模型中,提高分类识别率。(2)多层级联哈希模型。该模型主要利用有监督哈希学习作为基础哈希学习模型学习到高维度哈希特征,然后串联初始输入特征,再作为基础学习模型的输入继续学习到新的哈希特征,以此类推,经过多层次的级联得到最终的判别紧凑哈希特征。该模型的主要三个贡献。1)提出了一种哈希特征学习哈希特征的结构,同样继承了深度学习的优点;2)提出了将哈希码与前层的特征串联作为下一层的输入,这样简单且有效的特征连接方式提升了深层模型的训练效率;3)提出了一种新的预测标签正则模型作为基础模型,并且已有的有监督哈希模型可以整合到hashing in hash的结构中。(3)最优投影引导的迁移哈希模型。近年来,由于紧凑的二值编码(哈希码)在计算和存储上的高效性,哈希学习被广泛研究并用于图像检索。现有的方法需要足够数量的样本数据来学习获得准确的哈希码。然而,在一些实际应用场景中,兴趣域中训练样本数量通常是不充足的,因此难以学习得到准确紧凑的哈希码。此外,一些有监督方法还需要大量的有标签样本数据,但是给数据做标签需要大量的时间、人力、专业的知识。为了解决上述问题,受迁移学习的启发,本文提出一种简单而有效的最优投影引导的迁移哈希,该方法是一种无监督的哈希方法。该方法主要使用另外一个语义相关但分布不同的源域样本集来帮助感兴趣域(即目标域)学习更有效的紧凑的哈希码。本文旨在学习适用于源域和目标域的域不变哈希投影,从投影误差的角度入手,并寻求误差的最大似然估计来减少域差异。同时,本文采取变量迭代优化的方式来学习源域和目标域的哈希投影,两者相互影响和促进,最终获得最优哈希投影函数。实验结果证明了本文提出的最优投影引导的迁移哈希方法优于很多现有的哈希学习方法。

其他文献

大气硫循环模型研究

本研究主要以大气化学传输模式MOZART-4为研究对象,分析模型中含硫反应模块的组成,以2006年至2008年全球硫排放清单为基础,根据东亚地区的硫排放数据并结合该地区独特气候条

学位

大气污染MOZART-4硫循环SO2数值模拟

UHF RFID偶极子标签的天线刺绣制备技术及封装评价

可穿戴射频识别(RFID)标签在识别、监控和传感方面具有无限的应用潜力而受到广泛关注。其中,刺绣技术被尝试应用于制备标签天线,并有学者进行了大量研究。为了避免多个导电纱

学位

UHF RFID标签刺绣封装工艺阻抗读取性能

天牛须搜索算法的改进研究及其应用

优化问题在生活中的各个领域都存在,且与我们的日常都紧密相关。近年来,启发式优化算法的出现,丰富了优化问题的理论,且因其实现简单,并具有易扩展、高效等优点,而成为研究的

学位

天牛须搜索算法Lévy飞行反向学习随机时滞碳纤维预氧化

无线网络中基于视频业务的资源分配研究

随着无线网络的快速发展,人们对视频业务的各种需求也迅速增加。由于用户端设备种类的差异性,需要对视频进行转码以满足用户的不同需求。另一方面,由于无线网络资源具有动态

学位

雾计算边缘计算视频传输资源分配深度强化学习

马铃薯吸收与积累重金属的基因型与环境效应

土壤重金属污染已成为制约农业生产与威胁农产品安全的重要环境因素。马铃薯是全球第四大的粮食作物,在我国其主粮地位日趋提高。迄今,有关马铃薯重金属的吸收与积累的研究相

学位

马铃薯镉铬铅生物有效性基因型环境吸收富集分配

基于深度学习的交通场景目标检测研究

计算机视觉作为一个十分前沿而又活跃的研究领域,已经发展为人工智能最重要的分支之一。基于视觉的目标检测算法已经在各个领域得到应用,比如智能视频分析系统,工业智能制造

学位

深度学习小目标特征融合视觉注意力轻量化模型

南淝河流域环境雌激素迁移转化规律研究及其干扰风险评价

本文以南淝河及其四条支流作为研究区域,在对研究区域内现状调查、评价基础上,基于南淝河流域水动力条件结合区域环境雌激素负荷估算,应用MIKE 11软件构建南淝河流域环境雌激

学位

南淝河流域环境雌激素数值模型生态风险评估

基于层内-层间融合的小目标检测方法研究

随着深度学习技术的发展,基于深度学习的目标检测取得了显著进步,然而小目标成像面积小、背景复杂,难以提取高质量的特征,使得小目标检测依然是个难点及热点。目前基于深度学

学位

层内-层间融合小目标检测卷积神经网络组归一化K-均值

基于立体视觉引导的灵巧手抓取姿态研究

具有多自由度、多感知功能及良好的抓取操作功能的多指灵巧手受到了广泛的关注。由于灵巧手抓取模式的多样性和非结构化环境的复杂性,导致对目标物体的抓取规划变得非常复杂,

学位

灵巧手抓取位姿估计力封闭3D点云立体视觉

基于带关键字搜索的公钥加密体制的研究

随着云计算技术的不断发展与完善,越来越多的用户和企业将数据加密后上传至云端,通过云服务器对数据进行处理和加工,由此减少本地的计算和存储开销。带关键字搜索的公钥加密

学位

关键字搜索关键字猜测攻击无证书基于属性远程医疗

图像特征的判别与紧凑表达方法研究

其他学术论文