基于距离和密度的PBK-means算法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:zhucejuren2011
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
K-means算法初始中心点选择的随机性以及对噪声点的敏感性,使得聚类结果易陷入局部最优解,为获得最佳初始聚类中心,提出一种基于距离和密度的并行二分K-means算法。计算数据集的平均样本距离,根据数据点之间的距离计算数据的权重,选择最大权重数据点作为第一个中心点,小于平均样本距离的数据点不参加下一次聚类,将剩余数据点的权重与中心点距离相乘,选择值最大的数据点作为下一个中心点,得到两个中心点后按照距离对数据进行分配,将每个中心点代表的类分为两类后在每类上继续重复上述步骤。通过模仿细胞分裂的方法对数据进行切
其他文献
(接上期)  4底层漆膜微观结构的调查  秦俑彩绘底层对湿度变化非常敏感,在出土后的失水过程中,残存于陶俑表面的漆层很快发生起翘或卷曲,导致整个彩绘层的脱落.因此,对底
期刊
高校教育培养成本的核算是政府拨款的依据。如何核算高校教育培养成本.已成为社会广泛关注的焦点。明确高校教育培养成本的内涵,规范高校教育培养成本的内容、核算方法、核算手
石油企业实施精细化管理是适应新体制、新机制和市场经济发展的需要。文章以精细化管理理论为指导,结合石油企业管理实际,对石油企业精细化管理运行机制进行了设计,并主要从精细
论述了π型顶梁具有结构简单可靠、重量轻、支护强度大、安全性好的特点,适应中厚煤层,放顶效果好、资源回收率高,2002年在杨井24125工作面经过6个月的井下使用,共生产原煤15
目的运用荧光PCR溶解曲线法快速检测结核分枝杆菌对利福平和异烟肼的耐药突变,并将其与传统药敏试验进行比较,从而评价其敏感性、特异性及应用价值。方法收集南通市第六人民