基于谱正则化的线性降维方法研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:deng5384588
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于线性变换的特征提取一直是模式识别领域研究的重点,有着许多被广泛应用且被证明有效的方法。其中的主成分分析(PCA)和线性判别分析(LDA)经常被用于特征降维。本文的研究重点也是基于这两种方法所展开。   本文针对由于有限样本可能引起的小特征值对PCA结果的影响,将正则化技术应用到PCA中,提出了一种基于谱正则化的PCA,即ER-PCA,通过对其特征谱的正则化,降低了小特征值的影响。在人脸图像库和部分UCI数据集上进行的实验,证明了该方法的有效性。经典LDA方法经过特征提取后,产生的投影空间维数受限于样本的类别数,一般为类别数C减一。而且,LDA假设各类样本是满足高斯分布的,对于实际情况中的非高斯分布的数据,LDA分类效果不一定好。基于此,本文对原类内散布矩阵和类间散布矩阵进行了重新定义,其中引入了κ近邻(κ-NN)思想,希望依据样本的κ近邻来反映样本的分布,提出了一种基于样本κ近邻关系的LDA,即KNN-LDA。最后,通过在两个手写体数据集上的实验,可以看出,新方法不仅能够产生更高维度的投影空间(一般为样本维度n),而且要优于原LDA方法。
其他文献
学位
数据挖掘就是从海量数据中提取具有潜在价值的信息,是目前信息管理领域和数据库技术最前沿的研究方向之一。聚类分析作为数据挖掘技术中的重要组成部分,已经广泛应用于模式识别
DDoS攻击作为目前主流的网络恶意行为之一,对互联网的正常运行造成了严重的危害。本文的研究工作围绕DDoS攻击的检测和响应展开。检测工作基于网络边界路由器提供的流记录信
随着电子信息技术的飞速发展,汽车电子已成为现代汽车工业新的增长点,扮演着越来越重要的角色。同时,汽车电子系统的复杂性进一步加大了汽车电子软件的开发难度,普遍需要一个标准
经典粗糙集理论研究的对象是完备信息系统,完备信息系统中所有的属性值都已给定的且是单一的。然而,现实世界中的大量信息是不完备的,这些信息的属性值往往是未知的或是非单值的
一台机器履行职能的能力通常与人工智能有关,比如推理、规划、感知、认知、学习、理解和解决问题能力,在计算机学术界机器能力的研究是最有趣的研究领域之一。同时也是人工智能
信息化时代的今天,网络文本呈现出海量的特性,从搜索到的海量文本中提取有效信息或获取当前热点信息,需要对文本聚类,使同一个文本簇中的文本间相似度尽量的高,不同簇中的文
近年来,随着复杂网络研究的兴起,在复杂网络的结构性和动态性研究方面取得了许多令人振奋的成果。相关研究表明,复杂网络对随机攻击具有很强的抵抗能力,但对蓄意攻击却极其脆
针对现有网络体系的不足,四川省网络通信技术重点实验室提出了面向连接的并且能保证用户服务质量的单物理层用户数据传输与交换平台体系结构(SUPA)。该结构根据带外信令的传
随着互联网技术的发展,电子邮件系统逐步取代了传统的邮件通信系统,成为人们日常生活中不可或缺的一个部分。但是,一些人受到金钱利益驱使,通过电子邮件大量散布恶意信息。在