模式分类中特征降维方法的研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:czwyaa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
模式识别的主要任务就是利用样本的特征,将样本划分为相应的模式类别。但在实际的处理过程中经常会碰到高维数据样本。一方面,数据的特征维数越大,则数据提供的有关客观现象的信息就越多。但另一方面,高维数据却给计算机的处理带来了巨大的困难,而且其中可能存在着较大的相关性和冗余,影响分类精度,这就是维数灾难问题。因此,特征降维是进行模式识别的重要任务之一。特征提取和选择是特征降维的主要手段。特征排序是特征选择的一个分支,其计算复杂度低,易于应用,能够一次将所有的特征进行排序,因此得到广泛的应用。本文提出了一种新的特征排序的方法用于处理降维过程中的特征选择问题。文中先回顾了特征降维的相关信息,介绍了概率密度函数估计,并重点论述了非参数估计法和Parzen窗口概率密度估计原理。然后设计一种应用Gaussian窗函数的Parzen窗口概率密度估计进行特征排序的方法,并讨论该方法的无监督和有监督的情况。在无监督的情况下,先对原始数据样本进行概率密度估计,然后对所有数据的某一维特征进行加权变换,再对变换后的数据样本进行概率密度估计,计算由该特征加权变换前后所引起的数据样本的概率密度距离,即前后两次概率密度的差值,把这个值作为该特征的评价得分,根据这个得分来对特征进行排序,通过选择合适的维数来达到降维的目的。在监督的情况下,充分利用数据的类别信息。先对所有数据的某一维特征进行加权变换,然后计算变换后的类别间的概率密度距离,类别间的距离越大,说明该特征对于区分各类别数据的作用越大,即该特征越重要。因此,把总体的类间概率密度距离作为评价特征重要性的指标,以此进行特征排序。本文详细论述了该方法的推导过程和算法步骤,并用Matlab编程实现。通过若干UCI机器学习数据集的实验验证,该方法可行且有效,并表现出比现有方法更好的效果。
其他文献
3D打印机是三维建模技术和传统打印产业结合的前瞻产品,目前以迅猛的速度向前发展。随着3D打印技术、先进制造业技术和网络技术的结合,3D打印产品创意呈现海量增长趋势,数据
本文对配电网中基波潮流和谐波潮流算法进行了研究和改进。首先,选择一种高效的算法作为谐波潮流计算的算法基础。其次,对粒子群优化算法(Particle Swarm Optimization,PSO)做详细分析并加以改进。对差分进化算法(Differential Evolution,DE)进行研究。并将改进后的PSO算法与其结合。最后,对无功补偿设备的优化配置做合理建模。鉴于辐射状配电网的网络特性,提出
随着计算机科学的飞速发展,计算机相关领域的应用已经深入到人们生活的各个方面,并起着十分巨大的作用。其中,人工智能与模式识别是计算机科学研究中比较前沿的研究课题,是计
为了求解问题,人们提出了各种处理精确信息、随机信息和模糊信息的方法,并且解决了不少问题。然而,在人类社会中还存在矛盾问题和矛盾信息,这种问题是对立的和不相容的。可拓学的
果蝇优化算法是由台湾学者潘文超在2011年提出的一种基于果蝇觅食行为的一种新型元启发式优化算法。相比其它一些群智能优化算法,果蝇算法拥有结构简单、参数少、易调节、易
网络隐蔽信道是信息隐藏技术的一个分支,属于网络安全研究范畴。与正常通信不同,网络隐蔽信道违反系统的安全控制策略,用本不用于通信的资源进行信息传输,将机密信息毫无察觉
人脸识别技术是近二十年逐步发展成熟起来的一门崭新的信息技术,是模式识别领域的重要研究课题,90年代更成为科研热点,在计算机视觉、客户身份鉴别、多媒体数据检索等领域有
无线传感器网络(Wireless Sensor Networks,简称WSN)因其广阔的应用前景和独特的技术挑战吸引了众多学者的研究兴趣,并逐渐成为了近几年来计算机网络领域中最为热门的研究内
随着网络的日益普及,互联网用户对网络的健壮性、安全性与灵活性提出了更高的要求。Peer-to-Peer(P2P)是一种新兴的分布式网络结构,它不同于以往的C/S、B/S的服务模式,允许网
无线自组网是一种有特殊用途的对等式网络,网络中各节点相互作为邻居节点的路由器,通过节点转发实现通信,这使其可以不受通信基础设施的约束和限制,在某些特殊环境或紧急情况