一种基于质心空间的不均衡数据欠采样方法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:snowl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对目前的分类算法在不均衡数据集上的分类效果不理想的问题,将监督学习和无监督学习相结合,提出了一种基于质心的欠采样——ICIKMDS。在现实应用中,一些数据并不容易获得,或者不同类型的数据本身在数量上就存在着差异性,因此造成了数据集分布的不均,如疾病检测中疾病患者和正常人比例的不均、信用卡欺诈中欺诈用户和正常用户比例的不均等。所提方法很好地解决了数据集不均衡的问题,首先通过求解样本之间的欧氏距离得到初始质心,然后采用k-means算法在大类样本集上进行聚类,使不均衡数据集在分布上更加均衡,有效地改善了分类
其他文献
介绍了具有无线通讯、智能寻径等功能的挖掘机器人的设计与制作;该挖掘机器人以玩具小车为车体,直流电机及其控制电路为整个系统的驱动部分,采用上、下位机分级控制模式作为
USB总线的实际传输速率与理论传输速率相差甚远,且不能保证其稳定性,一般在15MB/s-25MB/s左右;然而很多设计者在设计基于USB总线的高速数据采集系统时却并没有考虑到这一点,所设计
介绍了基于反射内存的放电控制系统的整体架构以及运行方式;系统通过反射内存,聚变等离子体放电的意图能够有效地、可靠地传递到各个控制子系统中;在HL-2A托卡马克(TOKAMAK)上的初
远程协同故障诊断的一个关键环节是诊断任务分配,而多个分解后诊断任务执行顺序确定也是诊断任务分配环节中不可避免的一个内容;基于D算法,建立了关键路径规划方法来进行诊断任
风洞设备的试验能力是一个国家航空航天水平的重要体现。而风洞试验设备的维修保障是确保装备性能、保持装备优良状态的重要举措,直接决定着风洞的试验能力。针对风洞试验装备
针对现代航空机轮加载试验台高可靠性和高精度的要求,提出了基于可编程计算机控制器(PCC)的新型机轮加载试验台控制系统的实现方法;系统以贝加莱PCC为控制核心,通过传感器实时
调峰机组的给水泵需要经常起、停和变负荷运行。因此,壳体必须具有足够的疲劳强度。为了稳定运行,在分析转子振动时必须考虑密封环内流体的动态特性。轴端密封以非接触式的迷
为解决高速串行链路数据时钟异步时数据恢复问题,提出了基于FPGA的高速串行链路数据恢复方案,设计了本地时钟与锁相环输出时钟组成的混合时钟域,阐述了在不同相位高速串行数据采
本文介绍了用输出反馈法设计的单元机组负荷-汽压系统和用随机模式寻优法确定二次型指标中的权阵.同时又用加入输出变量的偏差积分和简化控制器结构的方法.对七种系统进行了
期刊
针对倒车过程中视野受限而无法有效观察车后部障碍物危险的问题,设计的一种基于嵌入式处理器的可视化车辆倒行危险状况报警系统;设计通过压电式超声波发生系统发送超声波信号,传