基于数据点收缩的网格聚类算法

来源 :第七届中国Rough集与软计算、第一届中国Web智能、第一届中国粒计算联合会议(CRSSC-CWI-CGrC'2007 | 被引量 : 0次 | 上传用户：aswe19

【摘要】

：

聚类分析作为一种无监督的学习方法在模式识别、机器学习等领域得到了广泛的研究，并已成功应用于实际。随着网络的发展和信息收集技术的进步，实际应用的数据正变得越来越庞大和

【作者】

：

李伯阳陈黎飞姜青山黄斌

【机构】

：

厦门大学软件学院,厦门361005厦门大学计算机科学系,厦门361005

【出处】

：

第七届中国Rough集与软计算、第一届中国Web智能、第一届中国粒计算联合会议(CRSSC-CWI-CGrC'2007

【发表日期】

：

2007年8期

【关键词】

：

网格聚类聚类算法聚类分析网格算法簇间数据点

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

聚类分析作为一种无监督的学习方法在模式识别、机器学习等领域得到了广泛的研究，并已成功应用于实际。随着网络的发展和信息收集技术的进步，实际应用的数据正变得越来越庞大和复杂，因此对聚类算法产生了新的需求，如何在大规模和带有噪声的数据集中有效发现任意形状的簇就是其中之-。基于划分的聚类算法，如经典的K-MEANS，倾向于发现数据集中具有超球形状的簇且无法识别噪声；基于密度的聚类算法DBSCAN等可以有效地识别具有任意形状的簇和噪声，且在使用数据索引技术后可达到O(nlogn)的时间复杂度，但对于大规模数据集创建和维护索引需要较大的时间和空间开销。层次型聚类算法CURE采用收缩后的多代表点表示一个簇，可以识别具有任意形状和密度不均匀的簇，但其时间复杂度达到O(n2logn)。基于网格的聚类算法CLiQUE等可以识别任意形状的簇，并且其时间复杂度通常较低，但这些算法的聚类质量与网格划分的尺度密切相关，而确定划分尺度并非一项容易的操作。本文结合CURE算法和网格算法的优点提出一种新的聚类算法ShrinClus。该算法利用簇内与簇间数据点的密度差异，使数据点往簇内移动，让簇内变得更紧密而簇间变得更分离，从而查找准确的簇边缘来确定簇。ShrinClus能发现任意形状并具有密度差异的簇，具有接近线性的计算复杂度。

其他文献

水平井钻柱动力学特性研究

钻柱动力学特性分析是深入研究减摩减振、钻井参数优化、下部钻具组合优化、轨迹预测与控制的理论基础之一，本文以实钻水平井为对象，利用全井钻柱系统动力学理论和仿真技术，系统

会议

水平井钻柱动力学耦合振动系统仿真

空气钻井井斜及钻柱失效机理初探

空气钻井直井易斜、钻柱易失效是目前空气钻井面临的两个重要难题。本文从钻具组合动力学角度出发研究了空气钻井时钻具组合的等效形心涡动轨迹和涡动速度，分析了钻头上的动态

会议

空气钻井动力学特性井斜疲劳失效钻柱失效机理

哈萨克斯坦巨厚盐层SLK3井钻井液设计与应用

SLK3井盐岩段近4500m，盐下段泥板岩坍塌压力高，易垮塌，要求钻井液具有极强的抗盐、钙能力和抑制盐膏层的蠕变能力，同时要求钻井液具有极强的稳定井壁、防漏、堵漏能力。在分析地

会议

钻井液设计盐膏层性能参数

影响钻井速度因素及提速潜力分析

影响钻速的因素有地层因素、装备条件及技术水平、破岩方式与破岩工具、循环介质、钻井参数和钻井液体系等。本文分析了这些因素对钻井速度的影响、对高压喷射钻井、欠

会议

钻井速度喷射钻井影响因素潜力分析

热镀锌渣制备锌粉的试验研究

根据目前热镀锌行业的不断发展、锌资源日益减少和热镀锌渣产量逐渐增多的现状,热镀锌渣的再生回收问題逐渐成为人们研究的焦点。为此,本文从锌资源的回收再利用出发,提出了

会议

热镀锌渣金属锌粉再生利用粒度分布

高频交变磁场作用下热镀锌中Fe-Al-Zn相的连续分离研究

热镀锌液中的锌渣是影响镀锌板表面质量的最重要因素，为了减少镀锌板表面的锌渣缺陷，本文研究了高频交变磁场作用下热镀锌液中Fe-Al-Zn锌渣相的连续电磁分离行为。实验结果表明

会议

交变磁场热镀锌液锌渣电磁分离

高磷铁矿湿法脱磷研究

针对湖北大冶高磷铁矿进行了湿法脱磷的研究。铁矿中磷和铁含量分别为1.58％和49.85％。用矿物酸在室温下酸浸可以脱除高磷矿中的磷。磷的脱除率随pH值降低而升高。pH值由2变到1,

会议

高磷铁矿湿法脱磷矿物酸

气溶胶粒子在颗粒层中的收集效率试验研究

采用颗粒固定床过滤系统对含气溶胶气体进行过滤试验,通过改变过滤风速、滤料粒径、滤层厚度等影响因素研究不同粒径气溶胶过滤效率的变化规律,并通过模型计算分析了过滤机理

会议

过滤机理气溶胶粒子颗粒固定床收集效率

镁对钢中非金属夹杂物变性作用的实验研究

采用向钢中加入NiMg合金的方法进行钢中加镁的研究。分析过程样中全氧量、残镁量及夹杂物性质的变化,研究镁处理后非金属夹杂物变化过程及作用机理。结果表明:过程样中残镁量

会议

镁处理夹杂物镁铝尖晶石

偏序信息系统中基于属性优势度的一种全序化方法

信息系统作为数据的一种描述框架，广泛存在于数据库模型、决策分析、模式识别与机器学习等领域。粗糙集理论是Pawlak Z于1982年提出的一种在信息系统框架下研究不完整、不确定

会议

偏序信息属性优势度全序化法数据库模型模式识别粗糙集

基于数据点收缩的网格聚类算法

与本文相关的学术论文