Web文档聚类中k-means算法的一种改进算法

来源 :微型电脑应用 | 被引量 : 0次 | 上传用户：li438

【摘要】

：

文章介绍了Web文档聚类中普遍使用的基于分割的k—means算法，分析了k—means算法所使用的向量空间模型和基于距离的相似性度量的局限性，从而提出了一种改善向量空间模型以及相

【作者】

：

王子兴冯志勇

【机构】

：

天津大学计算机科学与技术系,天津大学计算机科学与技术系

【出处】

：

微型电脑应用

【发表日期】

：

2007年8期

【关键词】

：

文档聚类 k—means算法向量空间模型相似性度量权重评价函数 Document clusteringK-means algorithmVSMSimila

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

文章介绍了Web文档聚类中普遍使用的基于分割的k—means算法，分析了k—means算法所使用的向量空间模型和基于距离的相似性度量的局限性，从而提出了一种改善向量空间模型以及相似性度量的方法。实验表明，改进后的k—means算法不仅保留了原k—means算法效率高的优点，而且具有更高的准确性。

其他文献

《天问》“死则又育”、“后帝不若”再释

根据《凡物流形》等出土文献关于月亮循环往复变化的记载，“死则又育”的具体含义是指月亮的升落、晦明、盈缺的变化。从出土战国文献用字情况看，“后帝不若”的“若”可读为“

期刊

天问“死则又育”“后帝不若”

基于PXA270的电子纸显示系统设计

本文分析了电子纸显示原理以及电子纸显示的优点，提出一种全新的电子纸显示系统解决方案。采用基于Intel XScale架构处理器PXA270的电子纸显示系统，是一种高性能的完善的电子纸

期刊

XScale架构电子纸微胶囊电泳技术XScale micro-architecture Electronic paper Microcapsule El

远程教学设计的审视和思考——远程教学案例调查统计分析

电大远程开放教育采用广播、视频和音像教材、计算机网络等多种媒体,以学生为中心构建管理、教学和服务系统.随着网络远程教育的逐步发展,从Internet的教学设计现状来看,我们

期刊

远程教学学习状况调查分析Long-distance teaching Study condition Investigation and analysis

中国古代陶塑图像描绘在服装上的应用研究

本文以陶塑为研究对象,结合现代服装的设计语言将其应用于服装之上,以探索中国元素在服装设计中应用的新思路.

期刊

陶塑图像描绘服装设计

基于特征的人脸分类算法研究

人脸识别是计算机视觉、模式识别中的一个研究热点和难点。针对墨镜和口罩这两个属性对人脸图像进行分类,系统地研究了不同的人脸分类算法的性能,其中包括主分量分析(PCA)、线性判别分析(LDA)、相关系数(Correlation)、支持向量机(SVM)、Adaboost算法,给出了在OMRON人脸库上的实验对比结果。实验表明,降低特征向量的维数,可以大大的减少分类时间的开销,同时不会明显降低分类器的性能

期刊

主分量分析线性判别分析相关系数支持向量机ADABOOSTPCALDACorrelationSVMAdaboost

“学习型组织”与高职学习型教师队伍建设

党的"十六大"提出建设学习型社会,向小康社会迈进的奋斗目标.学校首先应该成为学习型组织,而教师职业的特殊性要求教师应成为学习型社会的先行者和示范者.对于创建学习型组织

期刊

学习型组织教师队伍建设学习型社会奋斗目标小康社会高职院校加强领导思想认识十六大先行者特殊性责任感learning organizatio

边际化：民国时期在华基督教会的生存态势

民国时期,西方在华基督教会出现"边际化"生存态势,主要表现为社会主导性丧失、侵略性消逝、自觉本土化三个方面,而这些边际化形态就是基督教会融入中国社会的起始和表征.

期刊

基督教会民国时期边际化生存态势Christianity Republican China Peripheralization Living condit

传统的塑形与现实的羁绊——论中国现代市镇小说中的女性形象

在中国现代市镇小说中，作家通过对市镇女性的现实生活与日常生存问题的反映，揭示了底层女性和知识女性在中国现代市镇这一特定时空里的生存现实与生命意义。市镇女性在传统与现

期刊

市镇小说传统现实女性形象

隐喻构造世界的实践诗学——论理查德·罗蒂的文学伦理学

罗蒂从文学整体论和戴维森的隐喻观出发，认为文学不仅仅是美的技术，还是重建世界的力量。艺术以私人或公共隐喻的方式构建出想象中的社会实践。在促进人类团结减少残酷的伦理实

期刊

罗蒂隐喻实践诗学文学伦理学

从教育公平视角看我国基础教育的均衡发展

教育公平是一个包含了教育平等并以平等为主要取向的相对概念或范畴，其主要特点是平等、差异和补偿，基础教育均衡发展是教育公平在实践领域中的具体体现。根据教育公平平等、差

期刊

教育公平基础教育均衡发展education equity basic education even development

Web文档聚类中k-means算法的一种改进算法

与本文相关的学术论文