基于多视图鉴别特征学习的分类算法

来源 :中国矿业大学(北京) | 被引量 : 1次 | 上传用户:Hzw_56
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
模式识别、机器学习等交叉学科需要从观察到的数据中发现规律。最近的十几年来,互联网、通信等信息技术得到了革命性的发展,而信息技术的发展促使当今社会所产生的数据量极速增长,其中有很多数据能够以多种不同的形式进行表示。比如,在互联网中,每个Web网页能够表示为其所含文档和指向它的超链接;人脸识别领域中,可以对同一人脸图像样本提取出不同形态的特征形式,如Gabor特征,HOG特征,LBP特征,PCA特征分别用来描述人脸的方向尺度特征,边缘轮廓特征,局部像素灰度变化特征以及整体主要信息特征等。传统的基于单视图的分析算法,仅利用单一视图内的结构特性,没有利用视图间的关联、互补信息,多视图学习方法则尝试在不同的视图之间提取出相互关联、互补的特征,从而可以改善在数据集上的学习或分类效果。因此在最近的十几年以来,多视图特征学习在机器学习、数据挖掘和计算机视觉等领域受到了广泛的关注。本文以研究多视图数据的分类方法为主题,以提取数据中的鉴别特征为重点,从子空间鉴别特征提取、半监督流行学习和鉴别字典学习三个方面入手,做了一些创新工作,其主要内容包括:(1)以典型相关性分析(Correlation Canonical Analysis,CCA)为基础,分别对鉴别典型相关性分析(Discriminant Correlation Canonical Analysis,DCCA)、多视图鉴别分析(Multi-view Discriminant Analysis,MvDA)、增强组合特征鉴别相关性分析(Combined-Feature-Discriminability Enhanced Canonical Correlation Analysis,CECCA)等算法进行研究分析,提出二重鉴别相关性分析(Dual Discriminant Correlation Analysis,DDCA)方法。DDCA算法设计的模型具有两点优势:其一,能够在每个视图内借助于Fisher鉴别分析(Fisher Discriminant Analysis,FDA)寻找投影向量以保证样本的可分性;其二,能够在视图之间分析样本的鉴别相关性,即寻找投影向量使得样本之间的类内相关性最大,类间相关性最小。DDCA是一种有监督的特征提取方法,相比较于CCA能够有效利用样本的标签信息;此外,传统相关性分析方法由于自身模型的限制,仅适用于两个视图之间,而忽略了视图内部自身的信息,而DDCA在同一视图内部和不同视图之间均能够对数据进行分析,基于以上几点,DDCA有助于改善分类效果。(2)在半监督场景下,提取每个样本的多个视图特征有助于进一步挖掘样本多方面的信息,目前已有学者和研究人员们提出了一些有效的半监督多视图学习方法。尽管现有的半监督多视图特征学习方法已经取得了一定的效果,但是这些方法并不能很好的同时考虑到视图内和视图间的鉴别信息,而且如何有效地提取无标记样本的近邻结构信息,也具有较大的提升空间。本文提出了一种新的半监督多视图特征学习方法,即半监督双重视图特征学习(Semi-supervised Dual-view Feature Learning,SDvFL),该方法可以让有标记、相同视图的异类样本之间互相远离,同时无标记、相同视图的近邻外样本之间也要互相远离;有标记、不同视图的同类样本互相靠近,同时无标记、不同视图的近邻内样本之间也要互相靠近。通过这种方式,SDvFL能够有效地挖掘多视图数据中的信息。(3)在(2)的基础上,研究半监督情形下不同视图之间的相关性,为了挖掘不同视图学习得到的投影矩阵之间的关联,引入了视图一致性的概念,提出了半监督双重视图一致性特征学习方法(Semi-supervised Dual-view Consistency Feature Learning,SDvCFL)。SDvCFL方法考虑多视图中的样本特征描述的是同一个对象不同方面的特性,那么不同视图特征学习的投影矩阵之间应该有一定的联系,因此不同视图的结构信息都是类似的,可以考虑让实际求解得到的不同视图之间结构信息的差异最小化,本文中称之为“视图一致性”,即通过视图一致性来进一步约束原始样本结构信息的差异性。(4)稀疏表示及字典学习技术在模式识别领域已经取得广泛关注,本文在传统单视图字典学习的基础上提出一种针对于多视图数据的鉴别字典学习方法(Multi-view Discriminant Dictionary Learning,MDDL),MDDL模型能够学习出结构化的鉴别字典,该字典具有三点优势:其一,同类样本能够使用同类同视图的字典进行逼近;其二,某一类样本由不同类所有视图的字典表示残差较大;其三,引入重构系数鉴别项进一步加强字典的鉴别能力。(5)在(4)的基础上,进一步分析稀疏重构系数的性质,在有监督的情况下考虑重新定义系数鉴别项,新的鉴别项能够使有标记、相同视图的异类重构系数之间互相远离,同时无标记、相同视图的近邻外重构系数之间也要互相远离;有标记、不同视图的同类重构系数互相靠近,同时无标记、不同视图的近邻内重构系数之间也要互相靠近,基于此提出了近邻多视图鉴别字典学习方法(Neighbour Multi-view Discriminant Dictionary Learning,NMDDL)。NMDDL方法在保证字典近邻关系的基础上进一步提升字典的鉴别性,最终能够有助于改善分类效果。
其他文献
SW270-2型履带式液压挖掘机上海建筑机械制造厂研究所邓国辉1前言为适应各类建设工程高质量、高速度、低成本、高效益的要求,上海建筑机械制造厂在借鉴R942型液压挖掘机引进技术的基础上,开
微博上引起热议的“重庆公交坠江”事件,充分反映了媒体议题设置是如何影响公众舆论的。此事件中媒体通过以下人为议程设置:抛出具有关注度的议题,率先控制舆论导向;报道过程
目前建筑工地大量使用门架升降机做物料提升作业。根据JGJ88-92《龙门架及井架物料提升安全技术规范》规定,必须设置钢丝绳断绳安全保护装置。发生断绳时吊篮下落(作自由落地运动),通常是
对1999年全省少儿体操比赛中女子一级组跳马规定动作比赛前6名运动员的动作完成情况进行全程观察,并对运动员助跑速度的测试对比,分析结果认为,目前我省女子少儿跳马一级规定动
稀疏表示是一种有效的信号表示理论,它通过模拟哺乳动物大脑皮层的编码机制,将信号表示为字典中少数原子的线性组合。这些原子及其相应的稀疏系数能揭示信号的本质特征和内在
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
军队财务收支会影响军队的经济活动,加强对军队财务的收支管理,能够提高军队资金的利用效率。但是,军队财务收支管理会受到经济发展状况的影响,也会受到过国家财力供给条件的限制
老式井架的通病与改进广西壮族自治区三建机修厂石连波近几年来的施工安全统计数据表明,井架使用过程中造成的伤亡事故有增无减,其原因是老式井架物料提升机存在设计结构上的先
直动推杆盘形凸轮机构,通过合理偏置,可减小推程压力角,从而改善动力性能。本文讨论了在基圆半径一定的情况下,偏距确定的方法。
一种结构新颖的履带行走机构长沙交通学院李万莉,李自光,颜荣庆湖南省公路管理局李家瑞SF-350四履带滑模式水泥混凝土摊铺机行走机构,主要由行走泵、电液控制系统、行走马达、第一级减