案例数据挖掘中的聚类算法研究

被引量 : 0次 | 上传用户:yanlian2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的不断发展,在各个行业中积累了大量的数据,但是,我们面对如此庞大数据的时候,经常会感到迷茫,不能够从这些数据中提取出对我们有用的知识,造成“数据丰富,信息贫乏”这种现状。在这种情况下,数据挖掘技术应运而生,它能够帮助我们从大量数据中提取出有价值的知识模式,被认为是最具发展前景的一项关键技术。聚类分析技术是数据挖掘的一项重要功能,近年来,聚类分析技术得到蓬勃的发展,出现了很多的聚类分析方法,例如,基于划分的方法、层次聚类方法、密度聚类方法、模型聚类方法等。这些方法在处理一般性问题时表现效果很好,但是,传统的聚类分析技术主要是针对结构化类型的数据和非结构化类型的文本进行聚类分析的,而对于案例这种半结构化类型数据的聚类分析的研究相对较少,因此,本文主要是在传统聚类分析技术基础之上提出一种全新的案例聚类分析技术。本文首先,简要的介绍了数据挖掘的概念、功能、所使用的方法与技术以及数据挖掘在现实生活中的应用。其次,介绍了案例的表示以及案例库的构造基本知识,主要包括基于关系数据库的案例表示和基于XML的案例表示。再次,介绍了聚类分析的相关概念,主要包括聚类的定义、步骤、所使用的数据结构及数据类型、聚类的方法和聚类的典型要求。最后,在前面章节所介绍的案例的表示以及聚类分析的基本知识基础之上,提出了针对案例的聚类分析技术,即基于几何光滑度的案例聚类方法,并对该方法进行了详细的阐述。
其他文献
纤维素酶单位酶活力较低、酶用量较高及酶自身易失活等因素依然是木质纤维素工业生产能源和生物基产品的瓶颈性问题。本文尝试在木质纤维素基质水解时添加一些非离子型表面活
本论题主要以盛、中唐时期禅宗思想流变为背景,以王维和白居易诗歌中的自然意象为视角,通过比较王、白二人的诗歌来深入研究禅宗思想对诗歌审美取向、审美观照方式和美学特征
以剩余污泥为底物和接种物,借助电化学交流阻抗等电化学分析方法,研究了阳极投加三价铁离子对沉积型微生物燃料电池(sediment microbial fuel cell,SMFC)电能输出及内阻分布
氮(N)和磷(P)是陆地生态系统的主要限制性元素,对植物生长起着十分重要的作用.本研究探讨了青藏高原亚高寒草甸围封地内,3种植物叶片氮磷化学计量特征在不同样地中的变化及其
曾子,名参,字子舆,孔子晚年杰出弟子之一,也是先秦儒学史上至为关键的人物。孔子之后,由曾子而子思、孟子,注重向内求索,发展儒家心性学说,形成思孟学派,其后便是孟子与荀子
近年来,我国高校的发展迅速,特别是高校进行扩招以后,使得许多高校的规模越来越大,这样就给许多高校的管理工作带来了巨大的压力,其中学校的教务工作就是其中之一。教务管理
随着电子商务和数据挖掘的发展,数据挖掘在电子商务中的应用将面临着更多的机遇和挑战。由于数据存在着不确定性,而且数据大多数是非线性、杂乱无章的,因此如何处理好这些数
<正>近日,格力自主研发的首台光纤激光切割机正式下线交付客户,并成功完成调试。这是格力高端装备在激光切割领域的又一次成功尝试。据悉,格力自主研发的光纤激光切割机采用
采用临场统计、观察和比较等方法对第九届全运会子足球比赛决赛阶段足球运动员的若干比赛能力进行研究,结果表明:中路进攻获得的射门以及进球率仍居首位,个人运球突破获得的
全国林业资源数据管理和服务建设涉及到多部门数据整合、分布式管理和多层次服务等诸多问题,本文结合软件工程、系统论等原理和技术,通过对我国林业资源数据和管理现状的分析