基于CURE聚类算法改进的原型选择算法

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:sailordong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统K近邻分类器在大规模数据集中存在时间和空间复杂度过高的问题,可采取原型选择的方法进行处理,即从原始数据集中挑选出代表原型(样例)进行K近邻分类而不降低其分类准确率.本文在CURE聚类算法的基础上,针对CURE的噪声点不易确定及代表点分散性差的特点,利用共享邻居密度度量给出了一种去噪方法和使用最大最小距离选取代表点进行改进,从而提出了一种新的原型选择算法PSCURE (improved prototype selection algorithm based on CURE algorithm).基于
其他文献
文章提出在系(科)建立年级教研组,与原有的教研室相互依托,相互补充,是完善高校基层教研组织建设的有效途径。
EAST已经初步建立较为完善的分析数据数据库,相较于存储原始采集信号的一级数据库,科研人员称这个包含EAST各个子系统(诊断、加热、加料等)具体物理信息的数据库为EAST二级数据
天然气开采方便,使用较为安全,因此在火电行业中发挥了一定的功能和作用。但由于受到天然气价格和产能过剩的电力格局的影响,使用天然气发电还存在一定的困难。随着我国节能
在电网企业信息化深入开展的同时,也对智能化电网以及建设的高效性提出了更高的目标。借助GIS服务平台能够将电网企业的资源通过图形展现出来,并采用结构化管理方式,使得企业
通过推进电力调度自动化系统的发展,能够有效地保障电力能源的输送,提高用户用电的安全性,全面提升安全防护级别。本文主要围绕电力调度自动化系统的安全保护问题展开分析和
在软件测试研究领域,测试用例约简一直以来都是研究的重点,目前的一些研究利用测试需求之间复杂的相互关系得到约简的测试需求集,在此基础上可以优化对应的测试用例集,但单个
软件测试是生产可靠软件的重要保障,对测试所发现缺陷的解决可以分为缺陷定位和缺陷修改两个步骤[1],其中的缺陷定位是最耗时的.通常情况下,测试套件中成功执行的测试用例都
随着智能化设备的日益更新和计算机储存数据能力的提升,制造业企业在其产品制造过程中产生了大量的流水线数据,如何充分利用这些数据一直是工业界的一个难题.本文根据制造业
随着经济和社会的快速发展,环境大气污染尤其是雾霾和有毒气体对人体的危害越来越大,于是对环境信息如PM2.5、温湿度、各种气体浓度等的监控要求愈来愈高.因此,研发和设计一种功能多样、可靠性高、便携性好的环境监测数据采集系统具有十分重要的意义.本文运用传感器及嵌入式技术设计了一种新型便携式综合环境监测数据采集系统.实验结果和误差分析表明该数据采集系统可实现实时数据采集和显示功能并保证系统数据的可信度,