基于概率模型的聚类集成算法

来源 :复旦大学 | 被引量 : 0次 | 上传用户:TT_sky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是一种用于探索数据的内在结构的重要技术,该技术在许多需要分析和处理多变量数据的研究中得到了应用。聚类算法通常按照一定的优化准则对数据进行划分,使得相似的数据被划分到同一个组,而不相似的数据被划分到不同的组。然而,由于大部分的聚类算法都对数据集的内在结构存在一定隐含的或者明确的假设,因而没有一个聚类算法适用于所有的数据集。因此,有学者提出了利用聚类集成技术,即通过结合多个聚类结果得到一个共识聚类的技术,来生成具有鲁棒性和高质量的聚类结果。目前对聚类集成技术研究主要集中在聚类集合的生成,聚类集合的选择和共识函数设计这几个方面。在这篇论文中,我们详细分析和比较了现有的聚类集成技术的特点。另外,我们提出了一种从概率角度进行分析的聚类集成算法。我们假设所有的我们观察到的聚类结果都是由同一个潜在的聚类模型在两个不同的概率参数的控制下生成的。然后我们使用一种EM风格的算法来寻找具有最大似然的潜模型。实验结果表明,我们的算法比一些已有的算法例如CSPA, HGPA, MCLA和EAC-AL的表现更好。
其他文献
随着计算机应用对社会生活各方面的渗透,利用计算机进行各种信息处理已越来越成为一种趋势,并且计算机安全也越来越受重视。这其中的身份认证,是计算机安全的重要机制之一。在安
本文以网络视频监控系统的实现技术和主动队列管理算法为主线展开研究,前一部分讲述了网络视频监控系统的发展现状、关键技术,详细介绍了网络视频监控系统的硬件组成及各个软
纹理是图像的重要特征,纹理分析也一直是计算机数字图像处理中基础而重要的课题。 本文提出一种新的纹理描述方法一多视点切割(Mu1ti-ViewpointsSlicing,MVS)方法。多视点切
近年来,一方面由于PSTN电话的高成本、不易维护和业务单一等缺点,已经不能满足人们的通讯要求;另一方面,随着VoIP技术的发展,IP电话以其易于扩展、与Internet的紧密结合和业务丰富
当前,基于802.11的无线局域网(WLAN)技术迅猛发展。相比有线局域网(LAN),无线局域网具有移动性、安装灵活性以及很强的扩展性,因而受到了越来越多的公司和个人用户的青睐。无线
随着多媒体技术的发展,计算机网络技术发展以及不断增长的信息需求,因此,各种信息系统中多媒体信息数据源,视频数据占有很大的比重。由于人们在各个领域越来越普遍使用数字化
上世纪九十年代以来,在产品设计制造领域中广泛采用了逆向工程(ReverseEngineering,RE)来缩短产品研制时间,逆向工程的含义是根据现有的产品模型,利用数字化测量设备获取实体数据
近年来出现的分布式拒绝服务攻击(DDoS)对网络安全和信息的可用性造成了巨大的威胁。DDoS攻击由于实现简单、破坏性很大,而被攻击者广泛使用。目前大多数的DDoS攻击通过TCP协
本文提出了一种基于金属磁记忆检测的钻具适用性评价方法。 在钻井过程中,钻具在井下承受着复杂的交变应力的作用,经过一段时间的使用后则会产生破坏。钻井实践表明,80%的钻具
本课题采用了面向对象的技术,同时又结合了当前变电站自动化技术发展的最新进展——IEC 61850 协议中的面向对象的统一建模的技术与概念,通过对在内存中建立的面向对象的内存