一种大规模高维数据快速聚类算法

来源 :自动化学报 | 被引量 : 0次 | 上传用户：sntatgh

【摘要】

：

提出了一种面向大规模高维数据的自组织映射聚类算法.算法通过压缩神经元的特征集合,仅选择与神经元代表的文档类相关的特征构造神经元的特征向量,从而减少了聚类时间.同时由

【作者】

：

刘铭王晓龙刘远超

【机构】

：

哈尔滨工业大学计算机科学与技术学院

【出处】

：

自动化学报

【发表日期】

：

2009年07期

【关键词】

：

向量压缩神经元合并类内相似度类间区分度

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

提出了一种面向大规模高维数据的自组织映射聚类算法.算法通过压缩神经元的特征集合,仅选择与神经元代表的文档类相关的特征构造神经元的特征向量,从而减少了聚类时间.同时由于选取的特征能够将映射到不同神经元的文档类进行有效区分,避免了无关特征的干扰,因而提升了聚类的精度.实验结果表明该方法能够有效加快聚类的速度,提升聚类的准确度,达到比较理想的聚类效果.

其他文献

微电网分布式运行控制策略研究

微电网是一种小型发配用电系统,包括分布式电源、负荷、配电设施以及监控和保护装置等,必要时还可含储能设备。为确保系统稳定运行,需协调控制各分布式电源输出的功率、电压

学位

孤岛微电网下垂控制分布式控制一致性算法边际成本微电网群

TNF-α和IL-8在幼兔机械通气肺损伤炎症反应中的作用

目的探讨肿瘤坏死因子-α(TNFα)和白细胞介素-8(IL8)在幼兔机械通气肺损伤炎症反应中的作用。方法27只健康幼兔随机等分为对照组、小潮气量组和大潮气量组,建立给予不同潮气

期刊

机械通气肺损伤肿瘤坏死因子-α白细胞介素-8

汉莲牌红曲灵芝丹参胶囊的配方论证及标志性成分和功能学研究

目的对汉莲牌红曲灵芝丹参胶囊配方进行论证并对其标志性成分和功能学进行研究。方法依据中医理论和现代健康理念,对其配方进行论证,按照国家标准要求和相关规定,对其标志性

期刊

汉莲牌红灵丹胶囊配方论证标志性成分动物和人体试食试验

打造以艺术交流为中心的旅游文化目的地——基于海南的现实条件和优势

2018年4月13日,在海南建省办经济特区30周年大会上,习近平总书记宣布:"党中央支持海南全岛建设自由贸易试验区,逐步探索、稳步推进中国特色自由贸易港建设."面对新形势、新政

期刊

海南文化艺术交流资源优势文化目的地

复方中草药制剂抗氧化及抗肿瘤作用的研究

目的研究以灵芝、红景天、蝙蝠蛾拟青霉菌粉为主要原料制成的复方中草药胶囊的抗氧化及抗肿瘤作用。方法以不同浓度的复方中草药胶囊进行总抗氧化能力试验(ABTS)、羟自由基清

期刊

灵芝红景天蝙蝠蛾拟青霉菌粉抗氧化抗肿瘤

逆向调强放射治疗肺癌患者发生放射性肺炎相关因素分析

目的分析逆向调强放射治疗(IMRT)肺癌患者的临床资料和放疗计划的物理参数,评估临床因素、物理参数与放射性肺炎发生的关系。方法回顾性分析63例实施IMRT的肺癌患者资料,比较

期刊

肺癌调强放射治疗放射性肺炎剂量体积直方图临床因素

臭氧-曝气生物滤池在再造烟叶废水深度处理工艺中的应用实例

再造烟叶废水含有烟草物质、细纤维、半纤维素、木质素等难生物降解的有机物,采用生物处理技术很难达到理想的处理效果。臭氧-曝气生物滤池技术将化学氧化和生物氧化技术有机

期刊

臭氧曝气生物滤池废水深度处理难降解有机物

甘蔗糖蜜脱糖技术的新进展

甘蔗糖蜜脱糖技术的新进展离子除去法＊结合离子交换脱盐＊＊技术给回收糖蜜中高达９０％的蔗糖提供了机会，而这些糖通常要损失到最终糖蜜中去。如果采用该新技术，总回收至少可提高三个单位

期刊

甘蔗糖蜜新进展预处理悬浮物甜菜糖厂甘蔗糖厂

多逆变器——电机推进系统的环流分析及抑制方法

根据多逆变器-电机推进系统的电路结构,应用戴维南等效定理,分析了环流的产生机理,得到并联逆变器推进系统的等效输出电路,从而可以简化控制系统设计。根据环流产生的机理,讨

期刊

多逆变器电机推进系统环流戴维南等效原理

粒细胞肉瘤9例临床分析及文献复习

目的探讨粒细胞肉瘤(GS)的诊断和治疗方法。方法回顾性分析9例GS患者的临床表现、病理分型、诊断及治疗方法。结果 9例患者均以淋巴结肿大、结外软组织肿块为首发症状。以粒

期刊

粒细胞肉瘤诊断治疗

一种大规模高维数据快速聚类算法

与本文相关的学术论文