基于数据点收缩的网格聚类算法

来源 :第七届中国Rough集与软计算、第一届中国Web智能、第一届中国粒计算联合会议(CRSSC-CWI-CGrC'2007 | 被引量 : 0次 | 上传用户:aswe19
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析作为一种无监督的学习方法在模式识别、机器学习等领域得到了广泛的研究,并已成功应用于实际。随着网络的发展和信息收集技术的进步,实际应用的数据正变得越来越庞大和复杂,因此对聚类算法产生了新的需求,如何在大规模和带有噪声的数据集中有效发现任意形状的簇就是其中之-。基于划分的聚类算法,如经典的K-MEANS,倾向于发现数据集中具有超球形状的簇且无法识别噪声;基于密度的聚类算法DBSCAN等可以有效地识别具有任意形状的簇和噪声,且在使用数据索引技术后可达到O(nlogn)的时间复杂度,但对于大规模数据集创建和维护索引需要较大的时间和空间开销。层次型聚类算法CURE采用收缩后的多代表点表示一个簇,可以识别具有任意形状和密度不均匀的簇,但其时间复杂度达到O(n2logn)。基于网格的聚类算法CLiQUE等可以识别任意形状的簇,并且其时间复杂度通常较低,但这些算法的聚类质量与网格划分的尺度密切相关,而确定划分尺度并非一项容易的操作。本文结合CURE算法和网格算法的优点提出一种新的聚类算法ShrinClus。该算法利用簇内与簇间数据点的密度差异,使数据点往簇内移动,让簇内变得更紧密而簇间变得更分离,从而查找准确的簇边缘来确定簇。ShrinClus能发现任意形状并具有密度差异的簇,具有接近线性的计算复杂度。
其他文献
钻柱动力学特性分析是深入研究减摩减振、钻井参数优化、下部钻具组合优化、轨迹预测与控制的理论基础之一,本文以实钻水平井为对象,利用全井钻柱系统动力学理论和仿真技术,系统
空气钻井直井易斜、钻柱易失效是目前空气钻井面临的两个重要难题。本文从钻具组合动力学角度出发研究了空气钻井时钻具组合的等效形心涡动轨迹和涡动速度,分析了钻头上的动态
SLK3井盐岩段近4500m,盐下段泥板岩坍塌压力高,易垮塌,要求钻井液具有极强的抗盐、钙能力和抑制盐膏层的蠕变能力,同时要求钻井液具有极强的稳定井壁、防漏、堵漏能力。在分析地
影响钻速的因素有地层因素、装备条件及技术水平、破岩方式与破岩工具、循环介质、钻井参数和钻井液体系等。 本文分析了这些因素对钻井速度的影响、对高压喷射钻井、欠
根据目前热镀锌行业的不断发展、锌资源日益减少和热镀锌渣产量逐渐增多的现状,热镀锌渣的再生回收问題逐渐成为人们研究的焦点。为此,本文从锌资源的回收再利用出发,提出了
热镀锌液中的锌渣是影响镀锌板表面质量的最重要因素,为了减少镀锌板表面的锌渣缺陷,本文研究了高频交变磁场作用下热镀锌液中Fe-Al-Zn锌渣相的连续电磁分离行为。实验结果表明
针对湖北大冶高磷铁矿进行了湿法脱磷的研究。铁矿中磷和铁含量分别为1.58%和49.85%。用矿物酸在室温下酸浸可以脱除高磷矿中的磷。磷的脱除率随pH值降低而升高。pH值由2变到1,
采用颗粒固定床过滤系统对含气溶胶气体进行过滤试验,通过改变过滤风速、滤料粒径、滤层厚度等影响因素研究不同粒径气溶胶过滤效率的变化规律,并通过模型计算分析了过滤机理
采用向钢中加入NiMg合金的方法进行钢中加镁的研究。分析过程样中全氧量、残镁量及夹杂物性质的变化,研究镁处理后非金属夹杂物变化过程及作用机理。结果表明:过程样中残镁量
信息系统作为数据的一种描述框架,广泛存在于数据库模型、决策分析、模式识别与机器学习等领域。粗糙集理论是Pawlak Z于1982年提出的一种在信息系统框架下研究不完整、不确定