基于样本选择的近邻分类算法研究

来源 :电子科技大学 | 被引量 : 7次 | 上传用户:goove8
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近邻分类算法因其简单有效等特性已被广泛应用于各大领域,但它的诸多弊端也日益显现。其中,复杂数据的出现导致分类器的时间空间消耗巨大,这就需要通过适当的数据预处理操作来改善数据集的质量。并且实际应用中对分类精度的需求在不断的提高,这就要求不断的更新分类准则,设计更优的分类算法。因此,本文围绕近邻分类算法的改进来进行研究和分析,主要研究内容如下:首先,概括总结了几种典型的近邻分类和样本选择方法,分析了它们各自的算法原理和其利弊,并简述样本选择与近邻分类之间的密切联系。然后,针对近邻分类方法需要消耗大量的时间和空间,并且其分类性能易受到噪声样本干扰的问题,设计了融合互近邻的样本选择方法(Sample Selection Algorithm Combined with Mutual Neighbors,MNSS)。MNSS算法利用互近邻的原理来删除原始数据集中的噪声样本和冗余点,提高数据集的质量,使得分类器更加鲁棒。其次,为了改善近邻分类的分类性能,将BP神经网络和基于类间样本之间相似性的伪最近邻(Pseudo Nearest Neighbor,PNN)相结合,设计了基于BP神经网络的自适应伪最近邻分类(Adaptive Pseudo Nearest Neighbor Classification Based on BP Neural Network,BPANN)。通过BP神经网络输入输出间的映射来自适应的调节待测样本与每类训练集中各近邻间的距离加权系数,从而弥补了PNN中主观确定距离加权系数造成算法不能得到最优距离加权值这一缺陷。并通过实验验证了该算法的有效性。最后,针对离群点对分类结果的干扰,我们受到PNN和局部均值原理的启发,提出了结合局部均值的伪最近邻分类(Pseudo Nearest Neighbor Combined with Local Mean,LMPNN)方法,进一步的提高分类器的分类精度。LMPNN首先通过MNSS方法预处理数据集,再利用测试样本在每类训练样本集里的多个近邻的局部均值信息来避免离群点对分类性能的影响,进而改善分类性能。通过和其他算法的仿真实验对比分析,表明了LMPNN算法的优越性。
其他文献
在房屋建筑工程中,能同时完成物料的垂直升降及水平移动的起重机械种类繁多,其中应用最广泛的是塔式起重机(以下简称塔机)。塔机具有其它起重机械难以比拟的优点,如塔身高,起重臂长,有效作业面广,能同时进行起升、回转、行走、变幅等动作,生产效率高。同时塔机也是一种蕴含危险因素较多、事故发生机率较高的机械设备,塔机一旦发生事故,造成的危害是不可估量的,轻则设备受损,重则机毁人亡,这给国家和人民的生命财产造成
现场总线作为新一代的控制系统实时性好,稳定性高,被广泛应用在工业现场,但它同时存在多个标准。这样,多种总线之间的通信将给用户带来很大的不便,而且现场总线普遍通信速率
目前,计算机视觉技术已经在人们实际生活和生产中得到了广泛应用,例如无人机实时定位导航、指纹识别、人脸识别等。作为代替人眼的技术,计算机视觉在测距和尺寸测量方面有着
人脸识别算法利用人的面部特征来识别身份,它在多个领域有巨大的市场需求,如出入控制、视频监控、机场安检、人机交互等。三维人脸识别技术是人脸识别方法的一种,它利用人脸的三
面对环境恶化和能源危机带来的双重压力,纯电动汽车已经成为未来汽车发展的主要方向。动力电池是电动汽车的能量来源,为了确保电动汽车能够安全稳定高效地运行,需对电池进行
随着金属磁性材料广泛应用于工业、国防等领域的重大装备中,对其结构健康状态进行及时有效的监测已经成为一个重要议题。磁光成像技术因其快速、可视化、高效等优点,在对金属
多重入制造系统是以半导体芯片、胶卷、多层印制线路板等生产行业为代表的复杂制造过程,随着科技的发展与微电子行业的崛起,其调度问题研究与应用成为控制科学与工程领域的研究热点。迄今,在生产过程调度方法研究上已取得很多理论成果,但仍难以胜任实际调度问题的求解。鼓-缓冲器-绳子(Drum-Buffer-Rope, DBR)方法科学地将投料和生产控制结合在一起,重点解决瓶颈问题,为该类系统调度方法研究提供新思
风速的准确测量在众多场合有着重要的意义。为获得准确的风速,风速测量方法也一直在发展。风速的测量方法经历了机械式、热线式、声波式等测量方法,现在比较常用的风速测量方法为超声波风速测量方法。但是由于超声波频率过高,在空气中传播距离短,导致其无法测量大空间范围内的风速。通过声参量阵系统可以产生高指向的低频声,声波能够传播较远的距离,声场特性分布明显,利用这些特性可以把声参量阵技术应用到大空间范围的风速测
倒立摆是一个典型的多变量、非线性、强耦合的自然不稳定系统。本文以二级倒立摆模型为研究对象。本文阐述了倒立摆系统控制算法的研究发展过程和现状,采用拉格朗日方程推导数
随着人类探索太空的深入,越来越多的空间任务要求挠性卫星能够进行姿态的大角度机动,以满足再定向和空间对接等各种任务要求,且机动过程中需实现快速机动和快速稳定的高性能