基于模拟退火算法的聚类分析在数据挖掘中的应用

来源 :重庆大学 | 被引量 : 0次 | 上传用户:zyh111111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是近年来发展起来的新技术,通过数据挖掘,人们可以将知识发现的研究成果应用于实际数据处理中,为科学决策提供支持。目前数据挖掘逐渐发展成为一个多学科领域,涉及到多方面的技术,特别是和计算智能方法的结合越来越紧密。聚类算法是数据挖掘中的核心技术之一,在整个数据挖掘过程中有着非常重要的作用。聚类算法的选择取决于聚类的数据、聚类的目的和应用。本文通过对数据挖掘技术中的常用聚类分析方法进行了详细的对比,并从综合评价聚类算法的5个方面对常用的聚类方法作了比较分析。在对聚类算法进行比较分析的基础上,从聚类的本质特点出发,将计算智能中的模拟退火算法应用到数据聚类中。模拟退火算法是模拟物理退火过程的一种随机优化搜索算法。算法以优化过程的求解与物理退火过程的相似性为基础,通过接受准则和对下降温度的控制,能够有效的克服优化过程陷入局部极小从而获得全局最优解。因此,在解决多维,非线性的复杂组合优化问题中得到了广泛的应用。本文针对标准的模拟退火算法的局限性,提出一种综合改进的模拟退火算法。算法对标准模拟退火算法的退火过程和抽样过程进行了修改。目的在于设计高效的退火历程,避免状态的迂回搜索。并将修改后的算法应用到聚类分析中进行验证。本文以中国股票市场从1992至2002年7月以来发行的一千多只股票在上市首日发行的各项相关数据为基础,利用综合改进后的模拟退火算法对其中的新股上市首日收益率进行聚类分析。分析结果表明大多新股在上市的首日便会有一个巨大的涨幅,由此产生远远高于市场平均回报的超额收益,同时结果表明改进的算法在保证聚类效果的前提下提高了算法的效率,整个过程算法的响应时间提高了近50%,具有较好的适用性。
其他文献
论文根据当前网络通信技术和微电子技术迅猛发展,以及涡街流量计在流量测量系统中广阔的应用前景提出了基于网络通信的低功耗涡街流量计。 首先介绍了涡街流量计工作原理以及当前的发展概况。接着从硬件电路设计和软件程序设计两个方面进行讨分析了低功耗技术在智能仪表中的应用。在此基础上完成了涡街流量计的数据采集通道和温压补偿电路的硬件设计。并对涡街流量计的人机接口技术做了详细的阐述。 最后介绍了仪表的
小提花织物广泛运用于毛纺织厂、色织布厂、衬衫布厂的纺织产品设计,针对小提花织物的Dobby CAD系统的开发与研制极大地减少了设计人员的工作量,大大地缩短了设计周期,提高了产
现今的电力企业管理信息系统主要采用客户端/数据库服务器两层结构,基于这种结构的管理信息系统存在着可维护性差、可扩展性差等种种弊端。针对这种情况,我们开发出了一套基于Windows DNA及COM+的电力企业管理信息系统,该系统采用的是客户端/中间服务器/数据库服务器三层结构,是一套分布式应用系统。本文详细介绍了该系统的设计与实现,并就该系统采用的关键技术进行了阐述。 本文首先介绍了MIS、W
自上世纪80年代开始,交流变频调速技术得到了迅速发展。鼠笼电机具有体积小、轻量化和高速、大功率等牵引传动所关注的特点,使得交流传动成为机车传动技术发展的方向。目前我国铁路系统正在推进直流牵引传动向交流传动过渡的“十年转换”工程,研究、试验和诊断、检修需要的功率分析仪的价格普遍比较昂贵,研究如何开发一种高性价比的测试仪器,实现交流牵引传动系统主要电气参数的采集、分析处理,方便现场维护、检修,具有重要
根据对无线资源优化的需求,该文利用控制理论中的优化方法研究了无线资源控制中的三个关键技术:功率控制、准入控制和分组调度.分别基于效用和非合作博弈理论研究了CDMA系统
该文以抚钢精轧模具钢台车式退火炉的自动控制系统设计为背景,在采用国外先进集散控制软、硬件产品的基础上,完成了退火炉自动控制系统的结构、功能设计和现场调试.该控制系
本文第一章对遗传算法及其基本理论进行了简要的回顾,然后在第二章里对并行遗传算法从其分类、工作机理等方面进行了介绍。本文第三章里对有关的MPI并行编程技术进行了介绍。
熔融碳酸盐燃料电池(MCFC)是一种洁净、高效的新型发电装置,适宜作大容量分布式电厂的供电装备.但是要真正实现MCFC发电系统的商业化,除了在材料和工艺等方面进行改进以外,还