【摘 要】
:
为了提高高维混合属性数据挖掘效果,提出基于K-Means聚类算法的高维混合属性数据挖掘方法。通过分析数值型数据和分类型数据相似度,获取高维混合属性数据度量标准,将簇中心点
【机 构】
:
晋中学院信息技术与工程学院,山西大学计算机与信息技术学院(大数据学院)
【基金项目】
:
带参照物的聚类集成方法研究(61773247)
论文部分内容阅读
为了提高高维混合属性数据挖掘效果,提出基于K-Means聚类算法的高维混合属性数据挖掘方法。通过分析数值型数据和分类型数据相似度,获取高维混合属性数据度量标准,将簇中心点设为簇里点的平均数值或质心,引入最大距离自动生成k值策略与坐标转换策略,优化聚类结果;依据欧几里得距离聚类剩余数据,根据最大间距对应的数据中心点坐标与半径,实现数据集聚类划分;通过判定聚类后数据噪音类别,计算各类别中类异常因子,经过降序排列,挖掘并标记异常数据。仿真结果表明,所提方法对高维混合属性数据具有理想的聚类优势与较好的挖掘稳定性。
其他文献
地处亚洲西部和非洲北部的阿拉伯国家有许多共同点,其绝大多数同属阿拉伯民族,信奉同一宗教伊斯兰教,有着共同的官方语言阿拉伯语,风俗习惯也大都相同.但是,阿拉伯国家之间又
随着我国经济的不断发展,对建筑的要求也越来越高,土木工程的施工质量直接影响着建筑工程的正常使用,土木工程建设的高质量高标准离不开土木工程的科学管理,本文将就土木工程
约旦地处西亚的阿拉伯半岛,与巴勒斯坦、以色列、叙利亚、伊拉克和沙特阿拉伯为邻,首都安曼市郊区的死海,举世闻名,南端的亚喀巴湾是它唯一的出海口.这个深藏于沙漠之中的小
在市场竞争日益激烈的新形势下,企业间的竞争在很大程度上取决于人才资源的较量,人才队伍的素质,体现着国有企业的实力,决定着企业的命运。本文试从国企的现状和问题分析入手