基于最小生成树思想改进后的KK-MEANS聚类方法研究及其在地震数据集中的应用

来源 :四川师范大学 | 被引量 : 4次 | 上传用户:assofour
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘(Data Mining)是从庞大的数据集或数据库中提炼有用信息的科学。它汇集了统计学、机器学习、数据库、模式识别、人工智能等学科的内容,是一门新兴的交叉学科。聚类分析是数据挖掘中的一个重要研究领域,是一种数据划分或分组处理的重要手段和方法。聚类的应用是非常广泛的,无论是在商务上、还是在市场分析生物学、WEB文档分类等领域中都得到了充分的应用。目前,聚类算法大体上分为划分的方法、层次的方法、基于密度的方法、基于网格的方法和基于模型的方法。这些算法存在如下的问题:符号属性问题、算法的效率问题、初值的选择问题、对输入顺序的敏感性问题、最优解问题、算法对输入参数的依赖性问题。本文研究基于划分的聚类方法中有效选取初值的问题。主要工作如下:首先,概括介绍了聚类分析的基本原理,并对聚类分析中的基本数据类型进行了描述。其次,在对各种聚类算法进行简单描述后,提出了本文所涉及到的基于划分的聚类算法,并提出了本文中的算法对聚类分析中的普遍存在的初始中心选择问题的处理方式。最后,给出了改进的基于划分的聚类方法,以及其中涉及到的最小生成树算法的基本思想即KK-MEANS,并通过实验有效验证了算法的可行性。
其他文献
目前,人们对网络服务的要求越来越高,同时这些网络服务也被大量地开发出来。如何管理和整合这些大量的、不断变化的服务成了必须要解决的问题。当前采用的GIS应用系统难于适
随着生物医学技术的快速发展,生物医学方面的文献也快速增长。例如Medline数据库2013包含超过两千万的生物医学文献,而到了2015年,包含的医学文献增加到了二千四百万。对于研
在虚拟仿真场景中,喷泉、火焰、水流、雨、雪等景物具有不规则几何状态、动态性和随机性,这些特殊景观的模型比较复杂,实时播放中的运算量较大。为了保证视景仿真的实时性,对
由于网络环境的复杂性,攻击手段的多样性,单一的安全技术已经无法满足对网络安全的需求。入侵防御系统是网络安全领域为弥补入侵检测系统以及防火墙的不足而新兴发展的一种安
低密度奇偶校验(LDPC)码以其接近香农限的性能和相对简单的译码结构而得到信道编码界的广泛关注。目前,编码复杂度是LDPC码实际应用的主要瓶颈,准循环LDPC(QC-LDPC)码是一类
近年来以P2P技术为核心的软件产品越来越为人们所接受和喜爱,也使P2P网络成为计算机领域研究与关注的一个热点,但是P2P网络中的节点不受约束,节点间存在自愿的交易行为等特点
从一个产品制造的产业链角度,其供应链很长,涉及很多具有供需关系的企业,而这些企业由于不是直接对接,因此一个企业很难获得其上下游合作伙伴的上游或下游企业的信息。然而随
近年来随着视频监控技术的发展,视频监控数据的存储与处理已成为智慧城市,智慧交通应用中的关键问题。现有的视频监控存储体系架构在应付数量越来越多的高清摄像头上已显得力
基于边界扫描测试技术的故障诊断突破了传统的管脚接触式检测理论和手段,可以解决其他技术无法完成的超大规模集成电路的测试问题,可以解决新型电子装备中含可编程超大规模集
研究意义:人脑是具备多种功能的,因此脑电图数据包含了不同功能所产生多种成分,为了针对各种功能进行分别研究,就需要将不同功能的数据分离开。由于在不同状态或不同条件下人