基于模拟退火算法的数据聚类技术研究与应用

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:ZHUTINGFNEG12
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库知识发现技术和数据挖掘技术的迅速发展,数据聚类技术作为数据挖掘的重要技术之一,在诸如市场分析、金融投资、医疗卫生等实际应用领域得到了广泛的应用.但是,由于传统的数据聚类算法在涉及到大数据集的聚类时,计算开销很大,效率很低,而使其实用性在一些相关领域中受到严重的限制.所谓大数据集,主要表现在以下三个方面:(1)在数据集中,数据项很多;(2)每个数据项的特征维数较高;(2)聚类的类别很多.长期以来,尽管人们提出了许多数据聚类算法,如K-means算法、KD-trees算法、Wavecluster算法等等,所有这些算法都试图解决在规模数据库的数据聚类问题.但是,几乎没有一种算法能在三种情况并存时仍能高效工作.针对这一问题,该文提出一种新的聚类方法,其主导思想是首先把一个求解数据聚类问题转换为一个图形分割寻优问题,然后利用一种改进的模拟退火算法,求出优化问题的全局最优解.实验证明该算法在上述三种情况并存时仍能高效工作,并能有效应用于实际应用领域.
其他文献
作为计算机软件的核心,操作系统的安全对于所有的计算机软件来说都至关重要。但是由于操作系统的规模非常庞大,而且结构极其复杂,这使得操作系统的安全问题存在非常多的不确
该文从预处理阶段的这两方面工作入手,郑重讨论了以下这几个方面的内容:1、系统分析了HTML文档解析处理的相关技术,其中包括传统的基于有限状态自动机的词法分析技术、基于递
该论文的研究重点主要包括牌照的定位、牌照中字符的分割和字符识别三部分,通过对图像处理和分析技术的综合运用和对问题本身特点的详细考察,最终实现了基于边缘特征和形态分
论文首先给出了时间自动机的定义及相关符号,然后对使用等价类方法构造区域自动机的描述进行了算法实现。该算法的空间复杂度是状态数目的几何级扩张。对上述算法做进一步改进
该文详细阐述了虚拟现实技术的含义、特征,在对CAI的技术特点、发展方向进行分析、讨论的基础上,论述了虚拟现实应用于教育的可行性、必要性,指出基于虚拟现实的CAI将是CAI发
该文对当前的各种Ad-hoc网路由算法进行了归类;对评测算法性能的标准进行了分析,提出的以字节数计量路由算法在MAC层产生的开销的观点;该文用仿真的方法对几种具有代表性有路
金融多媒体自助服务系统(Finance—Multimedia Auto-ServiceSystem)作为自助银行的重要组成部分与自动取款机(ATM)、自动存取款机(CRS)联合使用即可构成一个小型自助银行,越来越受到
单元测试是软件测试的最初阶段,做好充分有效的单元测试可以显著地降低软件测试成本,提高软件质量。代码测试系统(Code Testing System,CTS)是一个针对C语言的自动化测试系统,其
文章首先对XML做概述性介绍,包括XML的产生、优势、特点,及XML应用方式和领域.然后是对同步多媒体合成语言SMIL的研究,说明了SMIL语言的设计目标及定义,简单介绍了SMIL1.0规
该文对LDAP协议的主要内容进行了详细的分析,对目录数据库和关系数据库进行了比较,对LDAP协议的工作方式进行了讨论,给出了LDAP的拓扑结构.在信息模型中给出了目录项、属性、