结构稀疏学习及其在图像检索中的应用研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:NewMagic
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在数字信号处理和机器学习领域中,稀疏表示是一个基础且重要的研究问题,并在大量的实际应用中均表现出优异的性能。稀疏学习是一类基于稀疏表示的机器学习方法。经典的稀疏学习模型是基于零范数约束的线性回归模型,是一个NP-Hard问题。LASSO问题的提出使得稀疏学习问题从凹问题变成了非平滑的凸问题,从而奠定了稀疏学习成为一个热点研究方向的基础。尽管存在多种改进的LASSO模型,它们仍不能很好地处理呈非线性分布的数据,也不能充分地挖掘和利用数据的内部结构。为此,论文将在核(非线性)稀疏学习模型构建和结构稀疏学习模型构建两方面开展理论和算法研究。另外,由于智能电子终端设备的迅猛发展使得基于数字媒体数据的智能应用需求不断扩大,智能图像检索成为了现代互联网应用中的一个核心研究内容。一方面,人脸识别作为图像检索问题的特例,在遮挡等扰动情况下的鲁棒学习算法仍需进一步研究。另一方面,“不受限于数据模态”是构建新一代图像检索系统的基本要求,构建基于跨模态学习的检索技术是实现这一目标的重要途径。跨模态学习的目的是实现不同模态数据的直接匹配。然而,模态差异性的存在使得这种直接匹配难以实现。为此,在应用研究方面,论文将开展基于结构稀疏学习和跨模态学习的智能图像检索方法研究。论文的贡献主要包含以下几个方面:  (i)提出了基于核坐标下降的核稀疏学习方法和基于核同伦的核稀疏学习方法。其中,核坐标下降算法的核心思想是在固定其他坐标分量的前提下,对每一个当前坐标分量分别进行更新。而核同伦算法则在整个优化过程中维护一个支撑集合,并不断地对该支撑集合添加激活原子和剔除非激活原子。此外,在这两个核稀疏学习优化方法的基础上,针对人脸识别问题,论文提出了一种海明核构建方法,其核心思想是通过利用局部图像特征来构建基于非欧距离度量的核学习模型。对比研究表明,论文所提方法能更好地解决困难人脸识别问题中的小样本训练、随机噪声、局部遮挡以及剧烈光照变化等问题,具有更好的鲁棒性。  (ii)提出了基于特征结构学习的判别子空间学习算法,其目的是使所学目标子空间特征对局部遮挡等局部扰动情况具有更好的鲁棒性。该方法利用特征的局部结构对目标子空间进行稀疏约束,从而使目标子空间建立在具有局部部件的基向量基础之上。因此,样本数据的目标特征表达由具有不同局部部件的基向量的相关系数组成,进而可以更好地处理局部遮挡等图像的局部扰动问题。基于所构建的数学模型,本文还提出了一种学习多个并列判别子空间且进行子空间特征融合的方法,从而可以学习更为准确的局部部件。在两个国际著名人脸数据库上的实验对比表明,本文算法具有更好的鲁棒性。尤其是在具有局部遮挡和局部光照的人脸图像子集上,本文算法的识别性能提升十分显著。  (iii)提出了一种跨模态协同线性回归方法。该算法通过在回归目标空间学习一个能够联系不同模态的信息关联矩阵,实现了跨模态数据的交流和互补,使目标特征具有更好的鲁棒性。因此,在学习模型构建方面,该方法与传统的采用隐子空间来实现模态间信息关联的方法显著不同。此外,该方法具有两个优点。其一,该方法可适用于处理不同模态数据部分缺失的问题。这一点非常适合于图像-文本跨模态检索任务,其中图像数据或者文本数据通常并不成对出现。其二,该方法的学习模型紧凑,与训练样本数量成线性关系,核心算法收敛速度达O(1/t2)。因此论文所提方法具有良好的大数据处理潜力。在四个国际公开的“图像-文本”跨媒体检索数据库上的对比实验结果表明,所提方法的检索精度均超越已有的最好方法。  (iv)提出了一种可直接计算跨模态数据相似度的学习方法。不同于传统的跨模态隐空间学习算法,本文所提方法的核心思想是学习一个双线性跨模态相似度函数,并引入矩阵核范数来挖掘隐含于训练样本的低秩结构,从而提高学习模型的分类鉴别能力。此外,该方法可处理弱配对数据,打破了跨模态学习算法要求样本成对匹配的限制。在“图像-文本”跨媒体检索应用中,本文算法在两个国际著名多媒体数据库上的跨模态检索性能均已经超越已有的最好算法。实验结果验证了本文双线性相似度函数的有效性以及对跨模态数据的强大的学习能力。
其他文献
论文的主要研究方向是充分利用现有MIS管理系统和已投运的软硬件设备,创建面向物料管理的数据仓库,并给出该数据仓库的OLAP(在线分析处理)应用设计与实现.首先,论文阐述了物
该文研究了基于遗传算法的非线性系统辨识.首先,描述了遗传算法的基本原理和应用,以及该文用到的改进遗传算法.其次,讨论了非线性系统辨识方法和它的发展现状.然后,给出了应
该文是以上海梅山集团公司物资库存管理与控制为背景,根据梅山的具体情况,将传统与现代库存管理思想和方法相结合,研究制定库存控制优化方法.重点对以下思想进行拓展运用:市
该文的主要目的就是针对线性时延系统,设计控制效果较好、鲁棒性较强的控制器.为了深入地研究线性时延系统,首先从理论角度出发,研究了不同情形下线性定常时延系统的稳定性判
近年来视频监控在安防领域得到了广泛应用,与之紧密相关的智能视频分析技术的研究成果也大量出现。然而现有的大多数研究都集中在单一摄像机领域。虽然利用多摄像机获取大范围
数据采掘是从数据中识别方法的、新颖的、有潜在价值的、以及最终的可理解的模式的非平凡的过程.粗糙集理论可以直接从给定问题的数据对象集合出发,以上近似、下近似等近似集
该文从宏观和微观两个角度对学术类科技期刊的质量管理总是进行了讨论:宏观上各个部门在对全国的科技期刊进行评比时存在着如何使评比更客观反映各个科技期刊的真实水平的问
高速公路智能控制涉及到多门学科,特别是随着电子技术、计算机技术、通讯技术的飞速发展,高速公路智能控制系统的研制从设计思想、实现手段、性能要求等方面已不同于传统的设
该文所论述的LGCIMS作为CIM先进哲理在涟源钢铁集团有限公司的一个具体实现,充分体现了其利用计算机通信信息集成实现现代化生产制造的内涵.它的应用工程主体框架由成本信息
随着互联网进入Web2.0时代,以微博、Flickr、Youtube等为代表的网站已逐渐成为新兴的各种数据产生和共享的平台。伴随而来的是文本、图像、视频和音频等信息的迅速膨胀。在网