【摘 要】
:
K-means算法初始中心点选择的随机性以及对噪声点的敏感性,使得聚类结果易陷入局部最优解,为获得最佳初始聚类中心,提出一种基于距离和密度的并行二分K-means算法。计算数据
【基金项目】
:
中央高校基本科研业务费专项资金重点项目“基于大数据的城市公共安全风险预警研究”(17LZUJBWZD012),教育部哲学社会科学研究重大课题攻关项目“大数据驱动的城市公共安全风险研究”(16JZD023)
论文部分内容阅读
K-means算法初始中心点选择的随机性以及对噪声点的敏感性,使得聚类结果易陷入局部最优解,为获得最佳初始聚类中心,提出一种基于距离和密度的并行二分K-means算法。计算数据集的平均样本距离,根据数据点之间的距离计算数据的权重,选择最大权重数据点作为第一个中心点,小于平均样本距离的数据点不参加下一次聚类,将剩余数据点的权重与中心点距离相乘,选择值最大的数据点作为下一个中心点,得到两个中心点后按照距离对数据进行分配,将每个中心点代表的类分为两类后在每类上继续重复上述步骤。通过模仿细胞分裂的方法对数据进行切
其他文献
(接上期) 4底层漆膜微观结构的调查 秦俑彩绘底层对湿度变化非常敏感,在出土后的失水过程中,残存于陶俑表面的漆层很快发生起翘或卷曲,导致整个彩绘层的脱落.因此,对底
高校教育培养成本的核算是政府拨款的依据。如何核算高校教育培养成本.已成为社会广泛关注的焦点。明确高校教育培养成本的内涵,规范高校教育培养成本的内容、核算方法、核算手
石油企业实施精细化管理是适应新体制、新机制和市场经济发展的需要。文章以精细化管理理论为指导,结合石油企业管理实际,对石油企业精细化管理运行机制进行了设计,并主要从精细
论述了π型顶梁具有结构简单可靠、重量轻、支护强度大、安全性好的特点,适应中厚煤层,放顶效果好、资源回收率高,2002年在杨井24125工作面经过6个月的井下使用,共生产原煤15
目的运用荧光PCR溶解曲线法快速检测结核分枝杆菌对利福平和异烟肼的耐药突变,并将其与传统药敏试验进行比较,从而评价其敏感性、特异性及应用价值。方法收集南通市第六人民