典型相关分析的局部保持以及代价敏感的研究及应用

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:okdangdang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多视图的学习在最近十几年引起了众多研究人员的极大兴趣和关注。而传统的模式识别和机器学习的方法多是集中在单视图上进行的。这些单视图方法往往通过独立、交替的方法训练对应的分类器,从而再在独立的数据集上验证方法是否有效。单视图学习方法由于无法利用多维的关联信息因而在统计模式识别中的表现往往受到一定程度的限制。相比单视图学习方法,多视图中数据以多个视图(或特征集)的形式来描述。使用多视图数据的一个优点是可以利用不同视图之间的互补信息和相关信息。而且通过多个视图的学习方法我们可以发现视图之间的相关性,并抽取出关联特征,从而去除相关性较强的特征,提高在未知数据集上的处理稳定性与实际效果。   典型相关分析是一种无监督的多视图学习模型,并未有效利用样本的类标信息,因而在推广性上存在一定的局限性。本文中,我们关注于对典型相关分析模型作进一步拓展,提出具备更好的推广能力的分类模型。   在人脸识别中,很多研究学者推出了很多方法。典型相关分析也被应用于人脸识别。但是传统的典型相关分析在处理高维人脸数据上存在一定的困难,简单的利用主成份分析降维会导致很大的信息损失,无法完成有效信息的筛选和提取。特别在近些年,局部保持方法在模式识别领域得到了长足发展,通过局部近邻信息重建当前目标信息已经被证明是个非常有效的方法。因此,我们将局部保持的思想引入到典型相关分析中,提出了一个新的特征提取算法,称为一种新的应用于多维视图降维的局部保持典型相关分析。在我们提出的相关分析方法中,我们通过当前信息的近邻局部信息进行重新构建,从而使得视图中的关键信息均可重新构建同时还保持了特征的稳定性,这样可以在实际当中提高典型分析的可靠性和稳定性。通过一系列标准数据集上的实验结果我们可以看到该方法具有很好的实际效果。   与此同时,考虑到实际应用当中,方法的最终目的不再单一是识别率而是总体代价的控制,我们提出了基于代价敏感的典型相关分析,旨在降低总体分类成本,同时期望能够提高一定的识别率。代价敏感的学习方法可以使模型在构建的过程当中,通过学习逐渐适应并找到降低分类代价,提高分类精度的解决方法。在实际应用中可以应用于文本分类,搜索,人脸或者图像识别等等。在一系列标准数据集上,通过实验证明,代价敏感的典型相关分析同传统方法相比具有很高的优越性。
其他文献
博客,是一种通常由个人管理、不定期张贴新的文章的网站。随着博客的快速发展,博客作为一个重要的信息源的价值也在增加。在自然语言处理方面和其他方面存在着大量的对博客的
伴随互联网技术的迅猛进步,社会步入了大数据时代。人类日常生活中产生了大量的数据。未来,无论是在哪个领域,越来越多的决策将依赖于数据分析。如何合理高效地分析大量数据,
车牌是交通场景图像中十分重要的目标类,是交通领域智能视频分析的核心对象之一。良好图像质量的车牌检测与识别,已经有了较为成熟的实用算法;但针对各种复杂背景或松视角约
网络性能代表了网络基础设施向上层应用提供的服务质量,其对于运营商、用户以及应用都具有重要意义。网络性能测量可以为网络运营商提供网络性能监控的基础,为流量工程提供评测
近年来,互联网在人们的日常生活中扮演着越来越重要的角色,每天都会有纷繁复杂的新闻事件以各种各样的形式发布到互联网上。相对于以前传统的报刊杂志,在信息爆炸的当今时代,快节
组播是一种由单个或多个源发送数据包到群组主机的有效通信方式,IP组播技术主要通过路由器实现组播功能,在网络资源的使用上有较高的效率。但是,由于IP组播协议和模型的不足
家庭安全一直是人们关心的问题。传统的家居安防监控系统的各个控制子系统相互独立,未能形成一个有机整体,越来越不能满足用户的要求。安装安全的、符合要求的自动化智能安防系
随着电子商务的迅速发展,人们从网上获取的信息越来越多,顾客有了更大的选择空间同时也带来了一些新的课题。海量的数据信息增加了顾客购买所需的难度,在找到自己需要的商品前必
近年来,信息技术不断发展,互联网络技术在人们的生活中发挥着重要的作用。随之产生的海量数据中存在着大量未被挖掘的信息,没有有效工具的帮助,人们在寻找有效信息的过程中耗
电子邮件是当前互联网上使用最为广泛的服务之一,随着互联网及应用的不断发展,垃圾邮件大量蔓延,造成社会生产力的极大浪费。因此垃圾邮件过滤非常必要,具有重要的理论意义和社会