半监督判别分析方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:color5188
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
判别分析(DiscriminantAnalysis)是模式识别领域的重要研究内容之一。过去几十年来,判别分析在理论和应用上均取得了很大进展。然而,在一些实际应用中,当没有足够多的有标注训练数据时,判别分析的性能会迅速下降,甚至不能工作。而在图像识别中,通常可以很容易地获取大量的未标注数据。因此,同时利用有标注数据和未标注数据进行半监督学习的方式近年来引起越来越强烈的关注。本文将判别分析与半监督学习相结合,进行了有关半监督判别分析的研究。具体的工作如下:1.研究了如何利用未标注数据进行学习。并将其归纳成两大类方法:基于正则化的方法和基于有标注数据样本扩充的方法。其中,第一类方法主要利用了数据的分布关系;第二类方法则是在有标注数据指导下,将类别标号由有标注数据传递到未标注数据,从而获得更多类别的信息。2.提出了基于谱的直推式有标注样本扩充方法。首先将训练数据采用图模型表示,并假设数据的类别在图上平滑变化。然后,根据有监督信息建立正负约束矩阵,并利用有标注数据和未标注数据的关系,将谱的直推式形式化成为有约束的凸最优化问题。为了有效求解,根据正交投影矩阵的性质,将约束化简,并进一步转化成特征向量求解的问题,最终获得解析解。最后,提出了可靠估计样本的平衡选择策略。通过在投影空间建立置信度函数,并选择那些置信度较高的未标注数据加入原始有标注数据中,使得有标注数据集合得到扩充。3.对传统判别分析框架进行了扩展,提出了具有局部保持特性的半监督判别分析框架。首先,基于拉普拉斯的局部保持特性,建立正则项。然后,在扩充后的有标注样本集合上进行正则化的判别分析,以保持所有样本点在原始空间的局部几何结构。这样,既增强了算法的推广能力,同时在一定程度上避免了学习中过拟合问题的出现。4.将提出的算法应用到了实际的人脸识别任务上。我们的算法利用少量的有标注数据和大量未标注数据进行学习,通过在CMU-PIE和AR人脸数据库上的测试,表现出很好的性能,特别是在单幅有标注图像识别问题中,与经典的人脸识别方法相比,识别率的提高是极其显著的。
其他文献
医学图像三维重建,是计算机图形学和数字图像处理技术在生物医学工程中的重要应用。医学三维重建技术已经成为医院诊断、治疗的重要依据和手段,在医学诊断、手术规划、模拟仿
大量低成本、多功能、微小体积的传感器节点可以分布在一定的区域中形成大规模的、动态拓扑结构的、应用相关的自组织网络。良好的拓扑结构支持传感器网络中的诸多应用,数据
在传统的汽车车身网络中,大量的电子控制单元使得汽车内部导线的数量大大增加由此导致有限的车内空间被繁多的线束占据。随着电子技术的发展,传统式车身通信网络不再适用,汽
面对信息爆炸而产生的海量文本信息,如何更快速、准确地从中获取需要的信息,是人们普遍关注的问题。文本信息抽取的研究工作,便是在这种需求背景下产生的,旨在提供从海量联机
科学技术的日新月异和新军事革命的深入发展,战争的形态正由传统的机械化战争向信息化战争转变。在战争迈向信息化的进程中,信息要素已成为军队战斗力的基本构成要素,将取代物资
当前网络安全正遭受到日益严重的威胁,各种网络安全事件层出不穷。统计发现,攻击者在攻击网络系统时,主要以耗尽对方网络系统的资源为目的,如耗费被攻击者的内存资源、处理器资源
随着Internet的普及和发展,图像数据飞速膨胀,如何高效、快速的检索到所需要的图像数据成为当前图像应用领域的一个研究热点。为了便于图像的检索和识别,基于内容的图像检索
学位
基于内容的图像检索(CBIR)是多媒体信息检索领域的一项新兴技术。与传统利用文本标注的检索方式相比,它具有对图像内容描述充分、客观性强、自动高效等优点,有着极为广阔的应用
随着SOA架构的不断发展和成熟,整个IT业在向其转变。企业通过整合由其他企业提供的服务资源形成新的服务来满足用户不断变化的需求,从而增强市场竞争力。然而,各企业对外提供