基于Hash函数取样的线性时间聚类方法LCHS

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:hahaho520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为数据挖掘中的经典算法,k-中心点算法存在效率低、对大数据集适应性差等严重不足.该文针对这一不足,提出并实现Hash分层模型LCHS(Linear Clustering Based Hash Sampling),主要贡献包括:(1)将m维超立方体按等概率空间进行分桶,使得每层(即Hash桶)的数据个数相近,以较小的计算代价获得分层抽样的效果;(2) 新算法保证了样本具有对总体数据的充分的统计代表性;(3)从理论上证明了新算法复杂度为O(N);(4)对比实验表明新算法在数据集的个数接近10000时,效率比
其他文献
政府各种政策的落地和执行,需要以各种政府组织机构作为基本的承载体,只有立足组织机制之上,各种政策才能够转化为实际成果。政府活动中,无论是资金管理,还是政策执行,都需要政府机构来逐级落实。政府机构设立之后,需要相关的机构工作人员,如果能够对这些工作人员进行妥善的编制管理,则可以提高政府各种职能及政策的执行效果,因此人员编制在政府机构改革中的重要性不言而喻,从地方政策落实层面看,人员编制直接关乎各种政
步行是天赋的人权,是人类最基本、最传统的出行活动方式,在可达性、灵活性和出行成本上具有先天优势。随着绿色低碳、精明增长、存量规划、可持续发展等城市建设理念的发展,
通过对58例早期乳腺癌的回顾性临床分析,总结了早期乳腺癌的临床特点,并且分析了不同辅助检查的特点,从而提高早期乳腺癌的发现率.
汽车仪表板横梁(Cross Car Beam)作为汽车驾驶员座舱系统(Cockpit)的重要组成,支撑着仪表板总成、中控系统和转向系统等重要系统,发挥着重要作用。因此本文一方面针对其承载
一、无病毒苹果苗木1、宽条纹新2001富士:果个大,全红宽条纹,果面光洁艳丽,上色快,色不老。北京、上海、广东市场售价比较高,是目前新2001富士品系中比较好的品种。2、优选新
在很多全局优化问题中,尽管目标函数和限制条件通常为非线性的,但仍会遇到某些参数和某些目标之间存在一些已知的单调关系.本文研究了在全局优化中利用参数和目标的关系以得
目的:验证不同剂量的硫酸镁对Wistar大鼠局灶性脑缺血再灌注损伤的脑保护作用.方法:用线栓法制作Wistar大鼠大脑中动脉栓塞模型;设假手术组、对照组、硫酸镁治疗组:60mg/kg组
目的观察门脉高压症患者手术前、后应用易善复的临床疗效。方法13例门脉高压症并发消化道出血惠者,在一般常规治疗基础上,应用易善复注射液10ml加入5%萄糖注射液10ml中缓慢静注,
随着数字集成电路技术的快速发展,FPGA(Field Programmable Gate Array)芯片的集成度不断提高,内部嵌入了越来越复杂的IP核。TEMAC(Tri-Mode Ethernet MAC)是FPGA芯片内部一