一种大规模高维数据快速聚类算法

来源 :自动化学报 | 被引量 : 0次 | 上传用户:sntatgh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种面向大规模高维数据的自组织映射聚类算法.算法通过压缩神经元的特征集合,仅选择与神经元代表的文档类相关的特征构造神经元的特征向量,从而减少了聚类时间.同时由于选取的特征能够将映射到不同神经元的文档类进行有效区分,避免了无关特征的干扰,因而提升了聚类的精度.实验结果表明该方法能够有效加快聚类的速度,提升聚类的准确度,达到比较理想的聚类效果.
其他文献
微电网是一种小型发配用电系统,包括分布式电源、负荷、配电设施以及监控和保护装置等,必要时还可含储能设备。为确保系统稳定运行,需协调控制各分布式电源输出的功率、电压
目的探讨肿瘤坏死因子-α(TNFα)和白细胞介素-8(IL8)在幼兔机械通气肺损伤炎症反应中的作用。方法27只健康幼兔随机等分为对照组、小潮气量组和大潮气量组,建立给予不同潮气
目的对汉莲牌红曲灵芝丹参胶囊配方进行论证并对其标志性成分和功能学进行研究。方法依据中医理论和现代健康理念,对其配方进行论证,按照国家标准要求和相关规定,对其标志性
2018年4月13日,在海南建省办经济特区30周年大会上,习近平总书记宣布:"党中央支持海南全岛建设自由贸易试验区,逐步探索、稳步推进中国特色自由贸易港建设."面对新形势、新政
目的研究以灵芝、红景天、蝙蝠蛾拟青霉菌粉为主要原料制成的复方中草药胶囊的抗氧化及抗肿瘤作用。方法以不同浓度的复方中草药胶囊进行总抗氧化能力试验(ABTS)、羟自由基清
目的分析逆向调强放射治疗(IMRT)肺癌患者的临床资料和放疗计划的物理参数,评估临床因素、物理参数与放射性肺炎发生的关系。方法回顾性分析63例实施IMRT的肺癌患者资料,比较
再造烟叶废水含有烟草物质、细纤维、半纤维素、木质素等难生物降解的有机物,采用生物处理技术很难达到理想的处理效果。臭氧-曝气生物滤池技术将化学氧化和生物氧化技术有机
甘蔗糖蜜脱糖技术的新进展离子除去法*结合离子交换脱盐**技术给回收糖蜜中高达90%的蔗糖提供了机会,而这些糖通常要损失到最终糖蜜中去。如果采用该新技术,总回收至少可提高三个单位
根据多逆变器-电机推进系统的电路结构,应用戴维南等效定理,分析了环流的产生机理,得到并联逆变器推进系统的等效输出电路,从而可以简化控制系统设计。根据环流产生的机理,讨
目的探讨粒细胞肉瘤(GS)的诊断和治疗方法。方法回顾性分析9例GS患者的临床表现、病理分型、诊断及治疗方法。结果 9例患者均以淋巴结肿大、结外软组织肿块为首发症状。以粒