基于邻域模型的K-means初始聚类中心选择算法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:njuchen1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的K-means算法由于其方法简单,在模式识别和机器学习中被广泛讨论和应用。但由于K—means算法随机选择初始聚类中心,而初始聚类中心的选择对最终的聚类结果有着直接的影响,因此算法不能保证得到一个唯一的聚类结果。利用邻域模型中对象邻域的上下近似,定义了对象邻域耦合度和分离度的概念,给出了对象在初始聚类中心选择中的重要性,提出了一种初始聚类中心的选择算法。另外,分析了邻域模型中三种范数对聚类精度的影响,并和随机选择初始聚类中心、CCIA选择初始聚类中心算法进行了比较,实验结果表明,该算法是有效的。
其他文献
目的:探讨奥氮平治疗精神分裂症的疗效和安全性。方法:对80例精神分裂症患者随机分为奥氮平组和氯氮平组各40例进行双盲对照研究,采用阳性和阴性症状量表(PANSS)及不良反应量表(TES
三I算法是一种新的模糊推理方法,可以作为传统的模糊推理方法的修改和补充。系统地研究了三I支持度算法和反向三I支持度算法的连续性问题,并指出了基于一些常用的蕴涵算子的三I
将遗传算法与神经网络相结合,提出一种实数编码、自适应选择、算术交叉、高斯变异、爬山操作的改进遗传BP神经网络RCGNN,利用遗传算法对神经网络权值和阈值进行优化。以时间序
如何撰写手写讲稿,一直是广大教师,特别是青年教师积极探索和关注的问题。本文从讲稿的结构、质量角度入手,对手写讲稿从多个层面进行调查,找出影响讲稿质量的问题,分析其原