一种初值优化的K-均值文档聚类算法

来源 :江西师范大学学报:自然科学版 | 被引量 : 0次 | 上传用户:FSACN
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
K-均值算法是文档聚类中常用的一种划分方法.近年来,为提高聚类质量,出现了不少优化初始中心的改进算法.该文在基于密度选择中心点算法的基础上,建立了相似度概率模型辅助密度参数的确定,有效减少了参数选择的盲目性.同时,该文提出一种二分快速确定K值最优解的方法.大量实验结果表明,该方法具有理想的效果。
其他文献
为了提高单纯形法的效率,先证明定理,然后给出新规则,并详细描述了新算法的步骤,通过数值试验对新规则与Bland规则进行比较,结果表明该规则优于其他规则,从而证明了其优势性:既能避
通过对Brown等人介绍的5粒子纠缠态的新应用研究,利用5粒子纠缠态作为量子信道提出了一个单粒子任意态的信息共享方案.首先,发送者对自己拥有的粒子做一次4粒子von-Neumann联