Web文档聚类中k-means算法的一种改进算法

来源 :微型电脑应用 | 被引量 : 0次 | 上传用户:li438
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文章介绍了Web文档聚类中普遍使用的基于分割的k—means算法,分析了k—means算法所使用的向量空间模型和基于距离的相似性度量的局限性,从而提出了一种改善向量空间模型以及相似性度量的方法。实验表明,改进后的k—means算法不仅保留了原k—means算法效率高的优点,而且具有更高的准确性。
其他文献
根据《凡物流形》等出土文献关于月亮循环往复变化的记载,“死则又育”的具体含义是指月亮的升落、晦明、盈缺的变化。从出土战国文献用字情况看,“后帝不若”的“若”可读为“
本文分析了电子纸显示原理以及电子纸显示的优点,提出一种全新的电子纸显示系统解决方案。采用基于Intel XScale架构处理器PXA270的电子纸显示系统,是一种高性能的完善的电子纸
电大远程开放教育采用广播、视频和音像教材、计算机网络等多种媒体,以学生为中心构建管理、教学和服务系统.随着网络远程教育的逐步发展,从Internet的教学设计现状来看,我们
本文以陶塑为研究对象,结合现代服装的设计语言将其应用于服装之上,以探索中国元素在服装设计中应用的新思路.
人脸识别是计算机视觉、模式识别中的一个研究热点和难点。针对墨镜和口罩这两个属性对人脸图像进行分类,系统地研究了不同的人脸分类算法的性能,其中包括主分量分析(PCA)、线性判别分析(LDA)、相关系数(Correlation)、支持向量机(SVM)、Adaboost算法,给出了在OMRON人脸库上的实验对比结果。实验表明,降低特征向量的维数,可以大大的减少分类时间的开销,同时不会明显降低分类器的性能
党的"十六大"提出建设学习型社会,向小康社会迈进的奋斗目标.学校首先应该成为学习型组织,而教师职业的特殊性要求教师应成为学习型社会的先行者和示范者.对于创建学习型组织
民国时期,西方在华基督教会出现"边际化"生存态势,主要表现为社会主导性丧失、侵略性消逝、自觉本土化三个方面,而这些边际化形态就是基督教会融入中国社会的起始和表征.
在中国现代市镇小说中,作家通过对市镇女性的现实生活与日常生存问题的反映,揭示了底层女性和知识女性在中国现代市镇这一特定时空里的生存现实与生命意义。市镇女性在传统与现
罗蒂从文学整体论和戴维森的隐喻观出发,认为文学不仅仅是美的技术,还是重建世界的力量。艺术以私人或公共隐喻的方式构建出想象中的社会实践。在促进人类团结减少残酷的伦理实
教育公平是一个包含了教育平等并以平等为主要取向的相对概念或范畴,其主要特点是平等、差异和补偿,基础教育均衡发展是教育公平在实践领域中的具体体现。根据教育公平平等、差