论文部分内容阅读
随着近些年互联网技术和信息采集技术的快速发展,人们所获取的图像数据数量及图像维数都越来越高,如何有效地表达图像特征,方便图像的语义理解,已成为图像处理、模式识别及图像标注等领域亟需要解决的问题之一。 近年来,稀疏编码算法正获得越来越多的关注,它是一种无监督的学习算法,可以通过找到一组基向量组成的集合来撷取数据中的高阶语义信息并根据这一集合学习一个稀疏表达来重新表示原始数据。稀疏编码最初被应用于人类视觉皮层的建模,现在已经在信号处理、图像处理、模式识别等多种应用任务中显示出它的优势。 然而目前现有稀疏编码方法都没有考虑到数据空间中的几何结构信息。在许多的实际应用中,数据更可能处于高维环绕空间中所嵌入的低维子流形中。而这正是目前流行的另一重要机器学习方法——流形学习所要解决的问题。流形学习通过对高维输入数据进行学习,并保持某些数据特性以求在低维空间中可以恢复流形的内在结构,用尽可能少的特征维度去描述原始数据,从而实现数据降维或是数据的低维可视化等。在本文中,我们将会把流形学习的思想引入到传统稀疏编码算法中,以弥补传统稀疏编码算法在考虑数据几何结构的不足,本文的主要研究工作包括: 提出了一种基于图正则化的稀疏编码方法。在许多的实际应用中,数据更有可能处于高维环绕空间中所嵌入的低维子流形中,而不是原始的欧式空间。已有不少研究表明,数据中的内在几何结构信息对于提升数据之间的判别力很重要。然而,现有稀疏编码方法都没有考虑到数据空间中的几何结构信息。在本文中,我们提出了一种基于图的算法,可以利用数据中的局部流形结构来学习稀疏表达,称为图正则化稀疏编码。通过利用图拉普拉斯作为平滑算子,我们获得的稀疏表达可以随着数据流形在流形空间测地线上平滑地变化。从而更好的捕捉数据的几何结构特点,提高稀疏编码算法在图像分类与聚类任务上的性能。 提出了一种基于海森能量的稀疏编码方法。基于图正则化的稀疏编码所采用的是拉普拉斯算子作为平滑因子,但有研究表明在某些情况下,基于拉普拉斯算子的流形嵌入有时并不能很好地保留高维数据的局部拓扑结构。针对这一问题,我们又提出一种新颖的稀疏编码算法一一基于海森能量的稀疏编码去克服这个缺点。基于海森能量的稀疏编码算法基于二阶海森能量,能使得测地线距离下函数值的变化更倾向于一种线性变化。我们使用海森能量作为一个平滑因子去保留局部的流形结构。通过将海森能量以正则化因子的形式合并到原始的稀疏编码算法中,来使得获取的稀疏编码能更好的保持数据的流形结构,从而提升数据的判别能力,我们最终在图像聚类实验中证明了这一方法的有效性。 提出了一种基于流形稀疏编码和强化学习的图像个性化标注方法。如今伴随着社交媒体的流行,上传和分享照片给朋友和世界成为一种非常普遍的现象,这使得互联网上的个人图像内容急速增长。给个人图像添加合适的标签,有助于用户更好地组织图像,同时也使得图像的检索更加容易。我们提出了一个个性化图像标注的通用模型,它综合利用了基于内容的图像标注、个人历史标签和个人历史图像信息。将用户的历史标注图像考虑进去,我们可以从用户之前的标注过的图像中选取一些和待标注图像相似的图像,然后用这些图像的标签统计信息进行个性化标注,这样可以有效避免个人历史图像所带来的噪音。我们利用流形稀疏编码算法来分析图像内容,利用增强学习算法在组合候选标签的学习过程中自动地选取参数,通过这一框架,能较为有效的克服图像语义鸿沟问题,为用户提供更好的标注结果。