改进K均值算法在数据挖掘中的研究应用

来源 :河北工业大学 | 被引量 : 1次 | 上传用户:a272437762
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是多个领域的交叉学科,用于分析海量数据中的潜在关系以给人们提供有价值的帮助。聚类分析是数据挖掘中的重要技术,它是在无先验知识情况下,按照一定的要求和规律,将数据对象分组成若干个类,使同一个类中的对象有较高的相似度,而不同类中的对象相似度较低。因具有极高的实际应用价值,聚类分析己成为数据挖掘研究中一个非常活跃的研究课题。本文对K均值算法的改进进行了深入细致的研究;在分析模拟退火全局寻优技术和调和平均函数的基础上,研究了基于模拟退火的K均值聚类算法和基于模拟退火的K调和均值聚类算法;分别利用模拟退火技术和调和均值函数使算法来获取全局最优解和减弱算法对初始值的依赖;在对基于模拟退火的K均值算法研究中提出了DK-t0选取法来选取控制参数初始值t0,对基于模拟退火的K调和均值算法研究中提出KH&K结合法;通过对09年高考本科一批理工科提档线数据集聚类效果对比,证明采用DK-t0选取法的基于模拟退火的K均值算法优于随机t0选取法的基于模拟退火的K均值算法;通过对IRIS数据集的聚类,比较了K均值算法、基于模拟退火的K均值算法和基于模拟退火的K调和均值算法的聚类性能;最后将基于模拟退火的K调和均值算法运用于数据挖掘的实例中,对“校讯通”系统数据库进行聚类分析,实现了聚类算法在数据挖掘中的应用。
其他文献
多尺度函数与多小波由于在高压缩比的系数量化上提供了较单小波更大的灵活性与稀疏性能,在图像压缩领域得到重视,且将多小波运用到了三维视频图像编码中,目前,三维多小波视频
随着计算机软硬件技术的不断发展,大量的数据得以收集。与此同时,原有的数据处理及分析技术面临着越来越多的挑战。分类是机器学习和数据挖掘的一项基本任务,如何构建泛化能
如今,在三维应用(特别是电脑游戏)的推动下,实时三维图形技术的发展速度非常快,对计算机图形学相关领域产生了很大影响。但是,随着模型和场景复杂程度的急剧增长,实时性的要求也越
随着现代信息科技的发展,信息作为一种重要的资源正不断受到外部和内部的各种威胁,访问控制是一种保护信息安全的重要措施。近些年来,基于角色的访问控制(Role-Based Access
继主机计算、桌面计算之后,计算机迎来了普适计算这个新的计算模式。研究者们希望在该模式下,任何人可以在任何地方任何时候获取自己需要的任何服务。要成功的实现这一目标,对服
磁共振成像技术是一种无介入性伤害的医学成像技术,磁共振图像对医生的诊断起到辅助作用。使用计算机分析磁共振图像,能够提高诊断的效率和准确率,对疾病的预防和提前治疗具
语义Web技术解决了传统Web服务发现查全率和查准率低下的问题,已成为国内外的研究热点。然而由于语义计算的复杂性,导致了语义Web服务发现效率低下,如何在保证查全率和查准率
随着移动定位技术的发展,位置服务(Location-based Service)中的时空对象位置隐私保护技术成为学术界关注的热点。目前,时空对象位置隐私保护技术研究在情境感知下位置隐私保
随着业务规模的不断扩大以及业务变得越来越复杂,企业经常需要增加内部应用系统。如果这些应用系统在设计时没有将其作为整个企业信息系统的一部分,将造成各个应用系统之间的协
传感器网络的覆盖问题是传感器网络的重要研究内容,较强的监视能力和较高容错率对传感器节点的覆盖质量提出了较高的要求。论文从提高区域覆盖质量和延长网络使用寿命两个角