一种基于抽样的大规模混合数据聚类集成算法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:tezon1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
混合数据聚类是聚类分析中一个重要的问题。现有的混合数据聚类算法主要是在全体样本的相似性度量的基础上进行聚类,因此对大规模数据进行聚类时,算法效率不高。基于此,设计了一种新的抽样策略,在此基础上,提出了一种基于抽样的大规模混合数据聚类集成算法。该算法对利用新的抽样策略得到的多个样本子集分别进行聚类,并将结果集成得到最终聚类结果。实验证明,与改进的K-prototypes算法相比,该算法的效率有了显著提高,同时聚类有效性指标基本相同。
其他文献
嗜盐菌作为一种新型微生物资源,已经在很多方面得到应用。如:为微生物生理、分类,系统发育学和生命科学研究提供新的课题,因此,嗜盐菌已引起人们的广泛关注。文章主要讨论了
用直接酯化法合成了丙烯酸十八酯,采用正交实验和极差分析确定了最优酯化条件.用合成的丙烯酸十八酯与顺丁烯二酸酐共聚,得到二元共聚物型原油降凝剂.实验表明,在中原油田生
由于肾癌对放、化疗均不敏感,多年以来免疫疗法一直是治疗转移性肾癌的基础治疗方式。其中,白细胞介素2(interleukin 2,IL-2)相关疗法用于治疗肾癌已达20余年。虽然目前其广泛
研究网络资源管理中的负载均衡与优化问题,网络资源有限且负载具有突发性,造成资源浪费。采用传统单一蚁群算法或遗传算法均存在各自不足,难以适应用网络负载变化特点,使网络
介绍了基于垃圾邮件的蠕虫病毒的特点,并与一般蠕虫病毒的传播模式进行了比较.提出了一种针对垃圾邮件蠕虫病毒的防御系统设计,将免疫防护的思想应用到病毒检测系统中.该防御
晚明书法丰富多彩光鲜照人,活跃着两个创作意识不同的阵容:一是以继承为主沉浸于古帖者,其以董其昌、陈继儒等为代表;二是另辟蹊径异军突起的创新型书家,代表者为黄道周、倪
期刊
作物衰老是某个器官或整个植株的生命功能衰退、最终导致自然死亡的一系列变化过程.衰老和死亡是作物的必然终结.认识衰老的原因,设法推迟衰老的进程是可能的.据理论推算,如
高中地理教学应该注重体现学生在学习中的主体地位,着重培养学生的综合素质。教师在教学的过程中,要充分关注学生的生活世界,追求学生个人价值的实现。这一种教育理念,在高中
今年2月,胡锦涛总书记在省部级主要领导干部提高构建社会主义和谐社会能力专题研讨班上指出:“根据马克思主义基本原理和我国社会主义建设的实践经验,根据新世纪、新阶段我国
虚拟现实是一种可以创建和体验虚拟世界的计算机系统,当前关于虚拟现实(VR)技术的研究如火如荼,并将其大量应用于现实世界场景的模拟、游戏设计及教育教学(如虚拟实验室、数