数据挖掘中聚类分析算法的研究

被引量 : 0次 | 上传用户:high
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机应用的普及,信息系统产生的数据量日益增大,如何有效地利用巨量的原始数据分析现状和预测未来,己经成为人类面临的一大挑战。由此数据挖掘技术应运而生并得以迅猛发展,这是快速增长的数据量和日益贫乏的信息量之间矛盾运动的必然结果。数据挖掘(Data Mining),又称为数据库中的知识发现(简称KDD),是从大量数据中提取可信的、新颖的、有效的并能被人们理解的模式的处理过程。数据挖掘是一门新兴的技术,它以数据库技术作为基础,把逻辑学、统计学、机器学习、模糊学、可视化计算等多门学科的成果综合在一起,进行如何从数据库中得到有用信息的研究。数据挖掘技术得到了人们的普遍关注,广泛应用于银行金融、保险、公共设施、政府、教育、远程通讯、软件开发、运输等各个企事业单位及国防科研上。聚类分析是数据挖掘中的一个重要研究领域。所谓聚类,就是把没有类别标记的样本集按某种准则划分成若干类,使类内样本的相似性尽可能大,而类间样本的相似性尽量小,是一种无监督的学习方法。聚类分析通常是在没有先验知识支持的前提下进行的,它所要解决的就是在这种前提下,实现满足要求的类的聚合。聚类分析的研究主要集中在聚类算法上,产生性能好而且实用的聚类算法是其终极目的。迄今为止,人们提出了很多种不同的适用于数据挖掘的聚类算法,但这些算法仅适用于特定的问题及用户,而且它们在理论和方法上仍不完善,甚至还有严重的不足之处。对聚类算法的进一步优化研究将不仅有助于算法理论的完善,更有助于算法的推广和应用。本文对数据挖掘技术,尤其是聚类分析进行了较为系统地分析和研究,提出了一些改进的算法,主要包括以下一些内容:(1)数据挖掘技术的概述。介绍了数据挖掘的基本概念、分类、主要功能、关键技术以及典型应用等等。(2)数据挖掘工具的研究。介绍了进行数据挖掘的常用工具,通过具体实例对当今国际上先进的数据挖掘工具(SPSS和DBMiner)的性能进行了对比,并得出了结论。(3)聚类分析的综述。本文对数据挖掘领域的聚类分析方法及代表算法进行了分析,提出了数据挖掘对聚类的典型要求,并基于这些要求对数据挖掘中常用的聚类算法作了比较,以便于人们更容易、更快速地选择一种适用于具体问题的聚类算法。
其他文献
《共产党宣言》发表时马克思是30岁,恩格斯是28岁;列宁最初参加革命活动时只有17岁。中共一大召开时毛泽东是28岁,周恩来参加中国共产党时是23岁,邓小平参加旅欧中国少年共产
从新时代的要求出发,积极探索当代大学生党员理想信念教育的有效途径。通过阐述新时代大学生党员理想信念教育的重要意义,分析当今大学生党员理想信念教育的现状,提出创新教
倾听是教师与儿童互动的过程,是教师在认真听取儿童的各种观点、想法后,经过加工、整理、分析,以恰当的方式反馈给儿童的过程,是对话与交流的过程。教育始于倾听,教育过程就是师幼
谚语是一个民族生产、生活智慧的沉淀与结晶,是一个民族语言与文化的精华。谚语短小精悍、言简意赅,而且巧妙运用多种修辞使语句结构紧凑、生动形象。谚语内涵丰富、广博深邃
智能机器人研究的最终目标是使机械能够做出智能的行为,这要求机械能够对先前的经验进行学习从而能够适应不断变换的环境。机器人通过传感器来感知周围环境的变化,并通过自身
<正>"用户体验到底是什么,直到今天,在国内的用户体验行业内依然没有一个所有人都认可的定义。但大家都认同,确实存在着一套度量用户体验优劣的标准,而且这一系列标准是客观
期刊
振兴和改造东北老工业基地意义重大。经济决定金融,金融促进经济。现阶段,金融已经成为经济发展的核心,我国东北老工业基地的振兴和改造需要金融的发展来推动和促进。正是从
资产减值的会计思想可追溯到十一世纪的欧洲。到了二十一世纪,随着市场经济的发展、企业面临经济环境不确定性的加剧,资产减值会计得到了迅猛的发展,并成为当前各国会计制度
随着高校的发展,青年教师在高校教师中所占的比重急剧上升。青年教师正在成为高校教书育人的主力军,而且随着时间的推移,他们中的部分人将成为高校教师中的骨干。从青年教师总体
<正>曾国藩,中国近代政治家、战略家、理学家、文学家,官至两江总督、直隶总督、武英殿大学士,为晚清"四大名臣"之一、清代文臣封武侯(勇毅侯)第一人。曾国藩用人不崇尚深奥,