空间聚类算法的研究

被引量 : 0次 | 上传用户:linyi870821
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息技术的不断发展导致持续的数据收集和快速的数据积累。空间数据挖掘是在空间数据库中提取隐藏的未知模式,而空间聚类是空间数据挖掘中一个活跃的研究领域。本文第一部分提出了一种新颖的启发式选择边界对象的快速空间聚类算法DBSB,通过一个启发式函数近似选择相对于某个已知核心对象边界区域中的核心对象和边界对象,通过核心对象的序列来快速地扩展它们所在的簇,直至找到一些较小的簇。在此基础上再通过边界对象快速地合并某些簇,即算法通过两步聚类,达到最终的聚类。理论分析和实验结果表明该算法有效可行。随着分布式计算环境的广泛应用,由于数据和计算能力分布在不同的节点,本文第二部分设计了一种基于反向k近邻的分布式聚类算法DCRkNN,该算法在分布式数据挖掘的框架下利用反向k近邻的性质,分三个不同的阶段进行分布式聚类。首先是局部模型的确立,通过局部模型来近似压缩局部站点的数据集;其次在中央站点整合各分布的局部模型建立全局模型,最后根据全局模型更新所有局部模型。同时DCRkNN算法易于扩展到分布式离群数据挖掘中。理论与实验分析说明该算法和集中式聚类结果的质量相当,且在一定程度上保护了各局部站点的敏感数据,DCRkNN算法执行效率高,分布节点之间的通信代价小。
其他文献
可持续发展观是坚持以人为本,促进经济社会和人的全面发展的科学发展观。区域经济要实现健康快速的发展,必须在可持续发展观指导下,实现本地区产业结构优化升级,其中最重要的方式
针对我国电子政务系统存在的可扩展性差、容易形成信息孤岛等问题,本文提出SOA能较好地实现电子政务系统中的业务协同与信息共享。在介绍SOA的基本结构,分析我国电子政务的现
提高我国中小企业财务管理水平,提高中小企业自身素质,对促进企业健康发展和保持国民经济稳定增长具有重要的现实意义。本文针对中小企业财务管理面临的问题予以分析,并提出
近些年来,中俄间的贸易问题,一直受到许多学者的关注。本文以中俄间的贸易为研究对象,首先描述了中俄近些年的贸易现状、特点,结合我国现状指出发展双方贸易的重要性。随后结
汉语是一种缺乏形态变化的语言,语序是汉语重要的语法手段之一,而修辞是美化言辞的艺术,汉语语序的灵活多变又为它成为修辞手段之一提供了条件。本文就语序与修辞之间的关系展开
董事会秘书制度是源起于英国的一种法律制度,属纯粹的英美法系概念。我国于2006年1月1日实施的《中华人民共和国公司法》(以下简称新《公司法》)第一百二十四条规定“上市公
本文分析了电子商务系统的安全层次,以电子商务系统安全基本要求为出发点,对现代电子商务系统安全的主要技术进行了分析。
<正>户田芳树风景园林设计事务所自创建以来经历了近30年的漫长岁月。其间,社会给予了我们成长发展的机遇,我们也尽自己最大的努力回报社会,在各个领域积累了许多经验,并在各
钽铌冶炼过程中会产生大量工业废水。这些工业废水中主要含有铵离子(NH4+)、氟离子(F-)、硫酸根(SO42-)等离子。如何从钽铌冶炼废水中回收氨或铵盐、减少排放,实现钽铌冶炼废水的
数字水印技术作为数字媒体版权保护的有效办法,近年来在国内外引起了人们极大的兴趣。将数字水印应用于印刷防伪,不仅可以有效克服目前诸多防伪技术科技含量不高,升级慢、随