【摘 要】
:
随着信息技术的迅速发展,人们积累了大量的数据。如何从这些冗余数据中提出对人们有用的信息就成了如今亟需要解决的问题。数据挖掘技术就在这种背景下应运而生,并且发展了几
论文部分内容阅读
随着信息技术的迅速发展,人们积累了大量的数据。如何从这些冗余数据中提出对人们有用的信息就成了如今亟需要解决的问题。数据挖掘技术就在这种背景下应运而生,并且发展了几年就已经成为目前数据库和信息决策领域最为热门的课题和方向之一。作为数据挖掘中的一个重要分支,聚类分析是通过分析数据的相似性把大型数据集合分类,使得在同一个类里面的数据最为相似,而不同类中的数据又彼此相异,得到很好的分类效果。本文主要研究了聚类算法,所做的主要工作如下:1.利用密度聚类算法收敛速度快,层次聚类算法可以在不同粒度水平上对数据进行探测,而且容易实现相似度量或距离度量的优点,发现了一种新的基于密度的层次聚类算法,克服了层次聚类算法时间复杂度的问题,得到比较好的聚类结果。2.将免疫算法引入模糊聚类算法,克服了模糊聚类算法对初始值敏感容易陷入局部最优的问题。新的聚类算法能够在不给定初始簇数目的条件下得到准确的聚类结果。3.结合传统聚类算法与模糊聚类算法。利用密度算法对中心点不敏感的优点,将密度算法应用于模糊聚类,得到新的聚类算法应用于数据量大的数据集时,它的准确率要明显高于模糊聚类算法和免疫算法。
其他文献
在现代工业领域,提高轻合金板材成形性能研究成为板料成形技术的前沿问题之一。板材的成形性能与成形过程的应力状态密切相关,通过向板材施加法向压力,可以削弱板材微观结构
近年来,视频监控技术得到了快速的发展,基于嵌入式前端具有预处理功能的监控设备正成为当前研究热点。传统的嵌入式监控系统是针对具体应用的定制开发,在软件方面存在开发周
长期以来,语言被认为是高度系统化的、有规则控制的人类的行为。这种观点在近几十年里的语言学理论中占统治地位。实际上,在语言习得的研究中,许多学者都在探讨语言学习过程
从刮起“审计风暴”的2004年到被认为是“审计问责年”的2008年,我国经历了许多事情,也看到了问责的浪潮风起云涌。正是基于在“审计风暴”之后舆论界对“问责风暴”的期待,
国际服务贸易对一地区经济整体效率的促进和质量的提高有特殊的作用。随着近年来全球服务业的迅速发展,服务贸易对经济增长的影响也日益凸现。本文旨在分析我国服务贸易对其
随着我国金融体制改革的深化和国内、国际金融市场的激烈竞争,商业银行必须拓宽业务范围,向客户提供各种便捷、可靠的金融产品和金融服务。人民币对公结算作为传统的中间业务
甜瓜(Cucumis melo L.)是世界十大水果之一。它性喜温热,对湿涝环境敏感。中国长江中下游地区春季阴雨连绵,夏季经常出现暴雨常引起甜瓜幼苗生长受到抑制或死亡,导致产量下降
川东北复杂勘探区,由于受多期构造运动影响,造成了深部地层致密碳酸盐岩高压,直接关系到钻井、人身、财产安全,致使勘探难度增大。围绕着川东北地区深部碳酸盐岩地层孔隙压力
马克思主义经典作家在构建科学社会主义理论体系的同时,对当时的知识分子的阶级属性、地位与作用和具体措施等问题花费了大量笔墨来加以研究。在马克思、恩格斯看来,知识分子
简要介绍总图现场踏勘和调研工作的要点,着重从前期准备、现状调研、资料收集和整理等方面分析了踏勘工作的具体要求和重点,为现场踏勘和调研工作提供了具体的建议。