基于稀疏保持的典型相关分析及其应用

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:ssdkln
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的发展,人们越来越容易得到同一个事物多个不同视图的数据,而传统的机器学习方法大多是在一个视图上进行的。为了利用不同视图之间的相关信息和互补信息,人们通常分别在这些单视图上进行独立、交替训练分类器,然后再在独立的数据集上验证分类模型是否有效。这些方法仅仅使用了不同视图的互补信息,并没有将不同视图之间的相关信息利用起来。典型相关分析作为多元统计方法可以通过研究两组多元变量之间的线性关系,对多视图数据进行特征提取。此外,稀疏表示已成为当前机器学习和模式识别的研究热点之一。使用稀疏表示可以降低运算复杂度,节省存储空间。本文将稀疏表示的思想引入典型相关分析,提出一种有监督的多视图学习方法。主要研究工作如下:首先,提出了基于稀疏保持的典型相关分析方法。通过使用稀疏保持自适应选择样本局部信息,同时通过在同类样本之间计算权重矩阵,将样本的类别信息嵌入到算法中,使之成为有监督的学习方法。另外,引入交叉相关的思想,增强不同视图不成对样本之间的联系。通过使用核技巧将算法推广到特征空间,使算法能够处理更加复杂的非线性问题。由于引入了样本类别信息和交叉相关,基于稀疏保持的典型相关分析不仅可以提取相关特征,还可以在降维后保留尽可能多的判别信息。在人工数据集、多特征手写体数据集和ORL,PIE,YALE三个人脸数据集上进行对比实验,验证了算法的有效性。其次,借助类内相关和类间相关的思想,将基于稀疏保持的典型相关分析进行推广,使其能够处理样本缺失情况。在人工数据集、多特征手写体数据集和YALE人脸数据集上进行一系列实验,并且在医学图像上进行多模态分类实验。从实验中我们发现,我们的算法不仅能够更有效的提取特征进行分类而且对缺失样本个数不敏感。
其他文献
随着社会的高速发展和信息化技术的普及,世界各地每时每刻都有大量的时序数据在诸如金融、工业、社交网络等领域产生,且在量上呈现快速增长趋势。由于这些时序数据在监管、决
内存数据库利用内存中数据能被快速存取的特点,把数据库的工作版本放在内存中,避免了频繁的I/O操作,极大的改善了数据库整体性能。内存数据库应该以CPU和内存空间的高效利用为目
计算机、网络技术的飞速发展,使数字作品的安全问题面临严峻的挑战。数字水印技术是实现数字媒体防伪和知识版权保护的有效手段,现已成为信息安全领域的一个研究热点。本文的主
本论文根据企业对液位测量的要求,设计了一种以Atmel公司开发的AT89S51单片机为主要控制系统的电容式液位传感器。首先,在对传统电容式液位传感器的微小电容测量原理和优缺点
随着海上运输业和海洋石油开采的迅速发展,海洋溢油事故发生的频率很高,对海洋生态环境造成极其严重的破坏。海洋溢油事故发生后能否及时准确的检测到溢油,对降低溢油影响程度具
中文输入法是指为了将汉字输入计算机或手机等电子设备而采用的编码方法,是中文信息处理的重要技术。随着近些年来科技的不断进步,网络时代的来临以及电脑的普及,使得用户对于中
目前,为了满足实时应用在高性能和低能耗等方面日益增长的需求,多核处理器已经被广泛地应用到现代实时系统中。近来,电压/频率岛(voltage and frequencyisland, VFI)模式作为一种有效的能耗管理技术,已被多核系统的设计所采用。在多核实时系统中,任务通常需要访问全局共享的资源(如共享的数据对象和I/O通道等),因此,任务的运行要考虑同步,以及由此产生的同步开销。现有的关于多核节
低密度奇偶校验码(Low-Density Parity-Check Codes)是一种基于图模型和迭代译码的纠错编码方法,因为其逼近香农容量限的性能和译码算法的低复杂度,逐渐成为人们的研究热点。随
本文是在传统P300行列闪烁实验范式的基础上进行改进,同时增加了一个主动心理任务。第一个实验中,主动心理任务实验是判别颜色,同时设计了对比实验即计数。为了进一步验证主
近些年来,我国的医疗卫生事业取得了长足的发展,但与此同时,医疗事故时有发生,由此引起的医疗纠纷给医院和患者带来了不必要的麻烦,影响了社会的和谐与稳定。而引发这些矛盾的主要