面向不确定数据的近似骨架启发式聚类算法

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:yuqiang521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
不确定数据聚类是传统数据挖掘的扩展,具有广泛的应用背景和研究价值,受到研究者们广泛的关注。不确定数据聚类问题属于典型的NP难解问题,并表现出了典型的NP难解问题的特点。通常很难在多项式时间内获得NP难解问题的全局最优解,研究者们经常把聚类问题描述成组合优化问题,并设计启发式聚类算法对不确定数据聚类进行求解。现有的启发式不确定数据聚类算法中,UK-means和UK-Med oids算法都属于基于切割不确定数据聚类算法,它们具有容易理解和实现简单等特点,得到广泛的关注和应用,但同时它们也具有对初始解敏感的缺点,这严重影响了聚类质量。为了解决基于切割的不确定数据算法对初始解敏感的问题,本文深入研究了不确定数据聚类问题表现出的NP难解性质,分析了该问题的解空间的特征,并在近似骨架理论的基础上,提出了一种近似骨架启发式聚类算法APPGCU (APProximate backbone Guided heuristic Clustering algorithm for Uncertain data)。该算法流程如下:首先对原不确定数据集完成M次采样,在采样后的规模较小的M个不确定数据集上分别执行随机初始簇心的UK-Medoids算法得到M个局部最优解;然后通过对M个局部最优解求交集得到近似骨架,并从中提取出初始簇心;最后从初始簇心开始,使用UK-Medoids算法启发式搜索出聚类结果。该算法充分利用了近似骨架在启发式算法设计中表现出的优异性能,根据不确定数据聚类的特点设计了高效聚类算法。在充足的仿真和实际数据集中的实验结果表明,算法APPGCU的聚类结果明显高于现有的不确定数据启发式聚类算法,提高了聚类结果的质量。
其他文献
时间序列数据挖掘已经受到越来越多的国内外学者和专家的关注,因为时间序列中潜在隐藏着有用的规律和信息,人们希望能获取这些信息来预测未来以及进一步了解事物发展。然而时间
计算机视觉领域尤其是视频监控系统一直是近几年来研究的热点话题。视频运动物体提取是进行行为理解、分析和描述等高层次视觉操作的基础。视频运动物体提取也是目前图像技术
电容层析成像(Electrical Capacitance Tomography,ECT)技术通过其低成本的投入、广泛的适用范围、简单易操作的结构、非侵入式的检测方式以及良好的安全性能等特点,已经成为当
各种高新技术的飞速发展带动了无线传感器网络的产生和应用,并以其独特的网络结构和巨大的应用价值带来了感知领域的一场变革。作为一种新型的信息获取和处理技术,无线传感器
无论是在图形学领域还是计算机辅助设计及各种模拟计算方法中,特征都是几何模型中最重要的部分,由于其具有特殊的几何性质,被广泛应用于几何造型,网格分片,网格形变以及几何
支持向量机(SVM)作为一种新的人工智能技术,它最大的优势是解决了样本数据不足时的学习问题,并且得出了较好的效果。目前,SVM是人工智能研究的热点。诸多研究指出,SVM分类效
随着工业化的快速发展,视觉技术越来越多的与PLC一起应用到工业生产中。目前IEC 61131-3标准和PLC OPen国际标准只对逻辑控制编程和运动控制编程进行了规范,但没有制定PLC的
移动Ad Hoc网络是由一组无线移动节点组成,是一种不需要依靠固定基础设施的、能够迅速展开使用的通信系统。是完全分布式系统,不需要任何中心实体、自组织、自愈的网络。随着
随着计算机相关技术的飞速发展,实时系统的应用领域得到了极大的拓展。实时系统中很多动作的发生必须要满足规定的时间约束,否则可能会导致严重的损失。因此,如何保证实时系
褶皱是人类大脑皮层的一个基本形状特征,它对于刻画人类大脑的结构来说非常重要,这些褶皱的形状不仅在不同的大脑之间表现出差异性,而且在同一个大脑上的左右半脑上都显示出