稀疏编码研究及其在模式识别中的应用

被引量 : 14次 | 上传用户:xiaogege0451
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
稀疏编码(sparse coding)是神经生物学、心理学以及计算机科学的交叉研究领域。近年来,许多科学家对稀疏编码理论展开了全面深入的研究,并取得了一系列重要的研究成果。通过对稀疏编码的研究,可以使计算机在一定程度上模拟人类的感知系统,对于人工智能、模式识别领域的发展具有重要的实用价值。在模式识别领域,稀疏表示(sparse representation)被认为是一种新型、有效而且鲁棒的特征表示方式,成功地应用在了一系列实际问题中。本论文以稀疏编码理论为基础,针对当前模式识别领域的前沿研究问题——流形学习、目标回归和子空间聚类问题,提出了一系列基于稀疏编码的优化模型,对当前的方法进行改进或完善。本文的主要研究内容和创新点如下:1)深入分析稀疏编码理论,对“稀疏性”这一特性进行重点探讨。引入经典的稀疏正则化问题——Lasso问题,并对求解此数值优化问题的传统方法和最新提出的快速优化算法进行讨论,通过实验比较了它们之间的性能差异并做出相应总结。2)提出了一种基于l1图正则的半监督流形学习算法((?)l-graph regularized semi-supervised manifold learning, LRSML),定程度上解决了当前流形学习算法在邻域构造方面过于单一化,并且对数据噪声缺乏鲁棒性的问题。当前的流形学习算法通常都是基于欧氏距离来构造数据的邻域和局部结构。但是,数据的欧氏空间结构经常由于噪声的影响而受到破坏,所以鲁棒性是一个成熟流形学习算法所必须考虑的。在LRSML学习的过程中,构造了基于欧氏距离的KNN图和基于稀疏编码的l1图。该方法可以看成是流形学习算法Laplacian Eigenmaps (LE)和稀疏编码的一种有效结合。实验结果表明,LRSML算法能够构建反映数据本质的低维流形结构。为了进一步获得测试数据的低维表示,本文提出了一种基于LRSML模型的线性扩展方法Linear LRSML (L-LRSML),旨在获得保持LRSML流形结构的最优线性投影。通过人脸识别这一具体应用问题,将L-LRSML和当前一些常用的线性降维方法进行实验对比,实验结果表明L-LRSML模型的准确率是最高的。3)提出一种基于凸正则的稀疏回归算法(Convex Regularized Sparse Regression, CRSR),一定程度上解决了当前的回归算法对于噪声和异常数据缺乏鲁棒性的问题。CRSR使用低秩约束以及稀疏正则对回归模型进行建模,旨在去除数据集中的噪声和异常数据,同时构造基于干净数据集的回归模型。CRSR方法可以看成是Lasso模型和鲁棒主成分分析法的一种有效结合。针对人头姿态估计这一具体应用问题,论文中将CRSR方法和当前一些常用的回归算法进行了实验对比,实验结果验证了CRSR方法的鲁棒性和有效性。4)提出一种改良的稀疏子空间聚类算法(Refined Sparse Subspace Clustering, RSSC),定程度上解决了当前子空问聚类算法对于数据噪声缺乏鲁棒性的问题。通过对原始样本集进行低秩约束,RSSC旨在恢复数据的原始低秩结构,同时计算每个数据样本基于此干净数据集的稀疏表示。稀疏表示系数越大,说明两个样本之间关系越紧密,来自同一子空间的可能性也就越大。通过模拟仿真实验,验证了RSSC模型具有恢复原始数据低秩结构的能力。同时,RSSC模型所构造的相似度矩阵具有明显的稀疏性和块效应,为最终的数据划分奠定了坚实的基础。本文进一步针对运动分割这一具体应用问题,将RSSC算法和目前常用的子空间聚类算法进行实验对比,实验结果表明RSSC算法的子空间聚类误差是最小的。
其他文献
亚甲基四氢叶酸还原酶(methylenetetrahydrofolate reductase,MTHFR)催化5,10-亚甲基四氢叶酸还原为5-甲基四氢叶酸,是一种调节叶酸和蛋氨酸代谢的限速酶,在同型半胱氨酸代谢
发动机曲轴的应力集中现象严重,特别是在曲柄销圆角和主轴颈圆角部位的应力集中现象尤为突出,曲轴疲劳破坏往往发生于这些区域。随着发动机强化程度的提高,对于曲轴强度要求
在我国,继承的方式有法定继承和遗嘱继承两种,遗嘱继承作为其中一种方式在我国继承法中占有十分重要的地位,因此如何能使遗嘱继承等到更好的实践和发挥也成为继承法中的应有
<正>促进"镰刀弯"地区玉米结构调整是当前推进农业供给侧结构性改革的重要任务,涉及多个领域、多个环节、多方利益,在财政资金有限、商业性金融投贷门槛过高等条件制约下,政
本文借用"隐形的译者"这一后殖民主义翻译理论十分重视,而传统翻译理论及翻译实践与技巧研究则很少涉及的翻译现象,通过对1972年尼克松访华讲话翻译中的几个有趣问题的分析讨
改革开放三十年,传媒业在规模和实力上都获得了飞速发展。但仔细甄别传媒业内的性别系统,无论是主体结构、身份地位、文本内容还是形象识别,都呈现出巨大的差异。尤其在娱乐
教材是课程标准的物化形态,是学生达到课程标准中所规定的知识与技能、过程与方法、情感态度与价值观目标的内容载体。它具有为教学提供信息资源、为学生学习提供范例、促进
高校德育生活化是针对现行高校德育实效性不高、脱离学生的生活实际而提出的新型德育模式,它是指从受教育者的现实生活、现实存在、现实活动出发,在生活中对个体进行引导和教育
目的:研究骶髂关节(sacroiliac joints,SIJ)放射学阴性中轴型脊柱关节炎(Non-radiographic axial SpA,nr-aSpA)患者血清白介素-23(Interleukin-23, IL-23)水平,探讨IL-23水平与骶髂
龙岩市地处福建省西北部,水产养殖业优势突出。经过多年努力,2007年内陆养殖水面8590公顷,其中,池塘养殖2474公顷,水库养殖5786公顷,内陆养殖总产量3.5万吨。有大小水库300余