基于最小化训练误差的子空间分类算法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:zxy86983028
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
子空间方法是模式识别领域一个重要的研究方向,很多年来一直受到该领域学者们的广泛关注。Fisher线性判别分析方法(Fisher Linear DiscriminantAnalysis,FLD或LDA)及以其为代表的其他一些子空间分类方法,在分类问题中有着突出的作用。然而,这些子空间算法也存在一定的缺陷。其中最主要的问题是,大部分传统子空间算法的特征提取准则并不与训练误差直接相关联,而是根据某种准则由样本数据分布(通常假设为高斯分布)的统计特征得出。所以当统计准则不能正确反映样本分布情况时,算法往往会失效。这个问题导致传统子空间算法应用于某些数据分布较为复杂的情形时,难以取得理想的效果。本文所提出的方法正是围绕这个问题而展开的。本文第3章首先指出,传统的LDA方法由于其固有的缺陷,在处理多分类问题时,即使符类数据都满足高斯同方差分布,也可能无法找到最优分类子空间。接着通过分析数据样本分布与LDA算法得到的投影向量之间的关系,讨论了LDA投影向量与类间散布矩阵和类内散布矩阵特征值之间存在的关联,并以此提出一种基于遗传算法的LDA算法。该算法以子空间上的洲练误差最小为目标,通过遗传算法调整LDA算法中类间矩阵特征位的大小,达到搜索最佳特征子空间的效果。通过模拟数据和真实数据的实验,表明这种方法的分类正确率比现有的线性子间方法有所提高。集成学习理论中的AdaBoost(Adaptive Boosting)算法是一类以最小训练误差为准则构建分类器的学习算法。本文在第4章中通过结合AdaBoost算法与LDA子空间方法提出了基于提升自举LDA投影的特征提取算法,完成两类问题中的特征提取与组合。AdaBoost算法是一种将若干分类性能仅好于随机猜测的弱分类器提升为强分类器的算法框架,要求各弱分类器具有较大的分离度和不稳定性。所以,本文提出的算法首先借助Bagging(Bootstrap Aggregating)算法中的自举采样(Bootstrap Sampling)原理对训练样本进行随机抽样形成若干训练样本自举子集,再通过结合LDA算法和最近邻分类器由这些自举子集得出若干弱分类器,并由AdaBoost算法提升为强分类器。该算法克服了传统子空间方法特征提取准则不与训练误差相关联的弱点,生成的分类器有较好的泛化性能,能够很好地解决数据分布复杂的分类问题。文章通过复杂分布的两类问题实验证明了该算法的可行性和优越性。由于多类问题的研究,特别是人脸识别问题,具有更加广泛的应用价值,本文第5章在第4章的基础上,借助AdaBoost.M2算法与LDA子空间方法的结合将以上算法推广到多类问题中,提出了基于提升自举LDA子空间的分类算法。第5章通过改善的自举采样方法,使AdaBoost.M2算法在原有基础上更注重难分样本的分类,同时兼顾弱分类器的多样性,达到更好地提升和组合基于LDA子空间的弱分类器。通过手写数字图像和人脸图像识别的实验,比较了该算法与传统子空间方法及其他基于集成学习的分类算法的性能,征明了该算法的效果达到或超越了其它算法。
其他文献
混沌理论是动力系统最活跃的分支,是非线性科学研究的重要课题之一.它在物理、生物、经济学等诸多学科都有着广泛的应用,已经成为各学科领域关注的学术热点.在动力系统的研究
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
随着计算机和多媒体技术的高速发展,图像因为能简单和直观地概括、反映客观世界,逐渐成为社会生活中不可或缺的信息载体。属于图像分割领域的目标轮廓提取,或目标检测,目标边
在移动对象数据库的研究中,如何建模、索引并查询移动对象的位置信息是一个很重要的问题,学者们对此进行了大量研究,并提出了许多空间对象和时空对象的索引方法。但是传统的方法
随着社会经济建设的发展,企业在市场经济环境下面临愈加严峻的竞争。因此,企业应当加强财务管理,从而在竞争中站稳脚跟。本文主要研究影响企业财务管理职能的因素,并简要分析
以信息技术与图书馆服务整合为基点,分析和探讨了公共图书馆如何适应信息社会环境等问题,提出应从制度设计、服务转型、资源组织、人才培养等方面着手来实现图书馆服务模式的创
《汽车维护与保养》课程是维修专业学生必须要掌握的课程,但目前,中国汽车维护与保养教学中仍存在着一些问题。所以,如何提高汽车维护与保养教学的效果,本文将从汽车维护与保
信息网络技术的应用和政府网络环境为政府推行电子政务提供了平台,同时也推动了政府档案资源体系的构建、服务功能的拓展。在建设档案信息化发展的过程中,作为政府档案管理者,要
档案是对企业生产经营活动的全面记录和总结,对企业的发展具有至关重要的作用,因此,如何完善档案管理与提高档案的利用效率成为现下企业关注的热点问题。随着时代的发展,信息化已
产品设计方法在产品开发中起着重要作用。生命现象蕴涵着无穷的奇妙和灵巧,可为包括产品设计在内的各种复杂问题的有效解决提供启迪和灵感。近年来,随着各种仿生计算技术的不