基于流形学习的稀疏编码算法研究及应用

来源 :浙江大学 | 被引量 : 0次 | 上传用户:sheygy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着近些年互联网技术和信息采集技术的快速发展,人们所获取的图像数据数量及图像维数都越来越高,如何有效地表达图像特征,方便图像的语义理解,已成为图像处理、模式识别及图像标注等领域亟需要解决的问题之一。  近年来,稀疏编码算法正获得越来越多的关注,它是一种无监督的学习算法,可以通过找到一组基向量组成的集合来撷取数据中的高阶语义信息并根据这一集合学习一个稀疏表达来重新表示原始数据。稀疏编码最初被应用于人类视觉皮层的建模,现在已经在信号处理、图像处理、模式识别等多种应用任务中显示出它的优势。  然而目前现有稀疏编码方法都没有考虑到数据空间中的几何结构信息。在许多的实际应用中,数据更可能处于高维环绕空间中所嵌入的低维子流形中。而这正是目前流行的另一重要机器学习方法——流形学习所要解决的问题。流形学习通过对高维输入数据进行学习,并保持某些数据特性以求在低维空间中可以恢复流形的内在结构,用尽可能少的特征维度去描述原始数据,从而实现数据降维或是数据的低维可视化等。在本文中,我们将会把流形学习的思想引入到传统稀疏编码算法中,以弥补传统稀疏编码算法在考虑数据几何结构的不足,本文的主要研究工作包括:  提出了一种基于图正则化的稀疏编码方法。在许多的实际应用中,数据更有可能处于高维环绕空间中所嵌入的低维子流形中,而不是原始的欧式空间。已有不少研究表明,数据中的内在几何结构信息对于提升数据之间的判别力很重要。然而,现有稀疏编码方法都没有考虑到数据空间中的几何结构信息。在本文中,我们提出了一种基于图的算法,可以利用数据中的局部流形结构来学习稀疏表达,称为图正则化稀疏编码。通过利用图拉普拉斯作为平滑算子,我们获得的稀疏表达可以随着数据流形在流形空间测地线上平滑地变化。从而更好的捕捉数据的几何结构特点,提高稀疏编码算法在图像分类与聚类任务上的性能。  提出了一种基于海森能量的稀疏编码方法。基于图正则化的稀疏编码所采用的是拉普拉斯算子作为平滑因子,但有研究表明在某些情况下,基于拉普拉斯算子的流形嵌入有时并不能很好地保留高维数据的局部拓扑结构。针对这一问题,我们又提出一种新颖的稀疏编码算法一一基于海森能量的稀疏编码去克服这个缺点。基于海森能量的稀疏编码算法基于二阶海森能量,能使得测地线距离下函数值的变化更倾向于一种线性变化。我们使用海森能量作为一个平滑因子去保留局部的流形结构。通过将海森能量以正则化因子的形式合并到原始的稀疏编码算法中,来使得获取的稀疏编码能更好的保持数据的流形结构,从而提升数据的判别能力,我们最终在图像聚类实验中证明了这一方法的有效性。  提出了一种基于流形稀疏编码和强化学习的图像个性化标注方法。如今伴随着社交媒体的流行,上传和分享照片给朋友和世界成为一种非常普遍的现象,这使得互联网上的个人图像内容急速增长。给个人图像添加合适的标签,有助于用户更好地组织图像,同时也使得图像的检索更加容易。我们提出了一个个性化图像标注的通用模型,它综合利用了基于内容的图像标注、个人历史标签和个人历史图像信息。将用户的历史标注图像考虑进去,我们可以从用户之前的标注过的图像中选取一些和待标注图像相似的图像,然后用这些图像的标签统计信息进行个性化标注,这样可以有效避免个人历史图像所带来的噪音。我们利用流形稀疏编码算法来分析图像内容,利用增强学习算法在组合候选标签的学习过程中自动地选取参数,通过这一框架,能较为有效的克服图像语义鸿沟问题,为用户提供更好的标注结果。
其他文献
集群系统开放性发展趋势、迅速增长的高性能事务处理应用需求以及移动计算模式的发展需求给集群文件系统提出了一些新的研究课题。本文面向Internet等大吞吐量事务性文件服务
本文提出了基于粗糙集理论的不完备信息系统的处理方法和基于沃尔什滤波的时序数据离散化的方法.粗糙集是建立在等价关系基础之上,用上下近似集合来表示一个不精确的概念.在
随着信息技术和计算机网络技术的不断发展,XML(Extensible Markup Language,可扩展标记语言)元语言特性及结构化的特点使其成为了互联网异构环境中不同类型和不同领域数据交
虚拟现实技术是20世纪末发展起来的一门涉及众多学科的高新技术,它通过计算机创造出的虚拟环境,通过人体的视觉、听觉、触觉、味觉、嗅觉等作用,使用户产生身临其境的感觉.VR
本文首先提出基于HTTP协议的即时通信系统的模型,对模型的设计将从硬件架构和软件架构两个方面展开.然后将对模型进行具体实现,重点解决不同服务器之间的通信、服务端的中间
移动IP在互联网上为移动计算机提供了不中断通信的无缝漫游协议。它突破了计算机机房、信息插座和地域等限制,允许移动节点在移动时穿过不同或者相似的传输媒介,使人们能够随时
移动多跳网MANET(Mobile Ad hoc Networks)是一种特殊的无线移动网络.网络中所有节点地位平等,无需设置任何的中心控制节点.网络中的节点不仅具有普通移动终端所需的功能,而
在海量数据环境中研究模式识别(或分类)问题时,常面临具有如下特点的数据:表示该数据的特征空间维数高,样本数量大而且所涉及的类别数目多。为了解决这类数据的分类问题,在分类器
澳门经济是一种典型的出口导向型海岛经济,对外贸易是澳门经济的生命线。随着中国加入世贸组织,澳门航运转口额将会增加,但现今澳门船运业基本仍然停留在以手工管理阶段,没有充分
植物种类繁多,其叶子、花朵、树干等都是植物分类的重要依据。在花卉种类识别中,由于其特征种类繁多,如何根据有效的特征对植物进行分类是研究人员的重要任务。在计算机发展