基于K-近邻准则的若干模式分类方法研究

来源 :陕西师范大学 | 被引量 : 11次 | 上传用户：xuezhenqian

【摘要】

：

由于K-近邻(K-NearestNeighbor,KNN)分类直观、简单、有效、易实现等优点,广泛应用于模式识别、机器学习、数据挖掘等领域中,更在2005年的ECDM国际会议上被选为十大最有影响

【作者】

：

马宏兴

【出处】

：

陕西师范大学

【发表日期】

：

2018年01期

【关键词】

：

近邻分类 K-近邻伪近质心近邻调和平均距离稀疏系数

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

由于K-近邻(K-NearestNeighbor,KNN)分类直观、简单、有效、易实现等优点,广泛应用于模式识别、机器学习、数据挖掘等领域中,更在2005年的ECDM国际会议上被选为十大最有影响力的数据挖掘算法。目前,在K-近邻方面的研究主要集中在对待测样本的分类正确性、减小分类搜索算法的复杂度、以及近邻k值的选择等方面。本文主要围绕K-近邻分类展开研究。首先,通过查找待测样本的近质心近邻,提出了伪近质心近邻分类算法(Pseudo Nearest Centroid Neighbor,PNCN),来解决在小样本数据集上的分类易受到局外点影响这一问题;其次,通过计算待测样本的多个调和平均距离,提出了基于调和平均距离的k近邻分类算法(Harmonic Mean Distance-based K-Nearest Neighbor,HMDKNN),来解决分类算法对近邻 k值的敏感性;最后,通过训练样本的稀疏表示系数来选择k个代表性最近邻,提出了系数加权 K 最近邻分类算法(Coefficient-Weighted K-Nearest Neighbor,CWKNN)和残差加权K最近邻分类算法(Residual-Weighted K-Nearest Neighbor,RWKNN),来克服使用欧氏距离查找近邻的局限性,提高近邻分类性能。本文的主要研究工作及创新点如下:1.为解决在小样本数据集中,KNN分类性能易受离群点影响这一问题,提出了伪近质心近邻分类算法(PNCN)。由于PNCN采用训练样本中每个类的k个近质心近邻点所对应的k个局部均值点来计算伪近质心近邻点,一定程度考虑到了待测样本近邻点的相似性和空间分布,从理论上来说,其分类正确率比其它类似算法要高。实验结果表明,PNCN分类算法与其它类似分类算法相比,无论是在真实小样本数据集上,还是有噪声的小样本数据集上,都有着较高的分类正确率,且对于近邻k值有着较好的鲁棒性。2.为了克服分类正确率易受k值的影响,提高近邻分类性能,基于局部均值向量和每个类中k个最近邻的多个调和平均距离,提出了调和平均距离k近邻分类算法(HMDKNN)。该算法首先在数据集的每个类中,计算待测样本的k个最近邻的局部均值向量,并计算每个类中k个局部均值向量的嵌套调和平均距离,将待测样本划分到最小嵌套调和平均距离值所对应的类别。由于采用多个局部均值向量、多个调和平均距离和每个类的嵌套调和平均距离,HMDKNN与其它类似算法相比,不管是在UCI及KEEL真实数据集,还是人工数据集、噪声数据集及时间序列数据集上,都进一步降低了分类时对近邻k值的敏感性,提高了分类正确率。3.由于稀疏系数能够较好地表现数据之间的相似性和潜在的可判别信息,通过计算待测样本x的所有训练样本的稀疏系数来选择k个代表性最近邻,提出了两种基于稀疏系数的加权近邻分类算法:系数加权K最近邻分类算法(CWKNN)和残差加权K最近邻分类算法(RWKNN)。在CWKNN中,通过稀疏系数选择待测样本的k个最近邻,并将每个近邻的稀疏系数作为其权重,用于近邻分类。在RWKNN中,通过稀疏系数选择待测样本的众个最近邻,然后计算这k个最近邻与待测样本之间的重构残差,最后用重构残差进行加权投票对待测样本进行分类。实验结果表明,CWKNN和RWKNN与其它类似分类算法相比,在真实数据集、人工数据集和噪声数据集上都具有更好的分类性能,且在近邻k值变化时其分类有着良好的鲁棒性。

其他文献

伍景医院体检中心业务发展战略研究

21世纪,中国经济高速发展,人民消费水平日益提高,城镇居民健康保健意识逐渐增强,医疗服务市场在这样的背景下逐渐扩大。自2009年“新医改”政策实施以来,中国政府针对医疗服

学位

体检中心业务发展战略健康体检健康管理

上市企业会计信息披露违规行为分析

作为资本市场重要的组成部分,证券市场的健康发展直接关系到我国社会经济的发展,而上市公司信息的真实性、完整性和规范性对证券市场的健康发展存在一定的影响。会计信息的披

期刊

上市企业会计信息披露违规行为

语块教学的主要心理认知理据与应用

本文探讨语块教学对提高语块意识和促进语篇生成技能的有效性,以及在外语课堂教学语境中语块教学应注意的问题,以期对课堂语言教学有所裨益。

期刊

语块教学教学语境心理认知应用

让产业扶贫挑起脱贫攻坚大梁

习近平总书记关于扶贫工作的重要论述,是我们打赢打好精准脱贫攻坚战的根本遵循和行动指南。《习近平扶贫论述摘编》全面系统收录了习近平总书记关于扶贫工作的重要论述,既是

期刊

产业扶贫脱贫大梁扶贫工作习近平发展产业总书记攻坚战

德国数字治理镜鉴下的中国国家治理现代化

当前,数字时代已经全面来临,从国内外学界的相关研究来看,国内外诸多学者在数字治理这一领域取得了很多有价值的研究成果。具体到德国数字治理这一领域来看,国内尚未查到标题

期刊

数字治理电子政务学术论文社会民主党中国知网国家治理现代化基民盟研究成果

独立学院ESP教学困境及对策探究——以四川外国语大学重庆南方翻译学院为例

独立学院的迅猛发展不仅实现了高等教育从精英化向大众化的转变,也给大学英语教学带来了诸多问题和困难。对四川外国语大学重庆南方翻译学院着眼于培养应用型人才开展ESP教学

期刊

独立学院EGPESP教学

基于K-近邻准则的若干模式分类方法研究

其他学术论文