Web检索结果快速聚类方法的研究与实现

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:cxksky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了帮助Web用户从搜索引擎所返回的大量文档片断中筛选出自己所需要的文档,在对聚类过程研究分析的基础上给出了一种Web检索结果快速聚类方法.它通过分析聚类过程,从建立索引模型、相似性的计算到聚类结果的形成等环节,都做了分析和简化,并利用检索结果的标题、Url以及文档片断3部分所含信息计算返回结果之间的相似度,将首先返回的部分检索结果利用无向图映射法进行部分聚类后,将其余返回结果分配到与之最相近的集簇中最终形成聚类结果.该方法实现简单.实验证明该方法响应速度快,聚类相关性较高,空间占用少.
其他文献
<正> 一九九五年是我国“八五计划”的最后一年,也是商业改革的攻坚年。今年柳州市商业工作的指导方针是:认真贯彻落实党的十四大及三中、四中全会精神,稳定市场,平抑物价;深
2019年第一季度的“爆款剧”是由正午阳光出品,简川訸执导的《都挺好》,该剧讲述了从小不受家人重视的“职场女性”苏明玉与原生家庭之间发生的一系列故事,它以高收视率、高
<正>经典作家早就指出,历史唯物主义是鲜活的行动指南,理论自身所蕴藏的适应力和对现实的解释力促使它能够对风云变幻的社会发展积极做出应答。诞生于一个世纪之前的历史唯物
会议
档案工作标准化是档案工作现代化的重要内容和前提条件。目前,我国档案工作标准体系还不够完善,主要表现在一些标准之间相互衔接不够,行业标准、地方标准与国家标准之间的关系没
11月17日上午,北京市海淀区档案馆就建馆20周年召开了纪念座谈会。国家档案局副局长中央档案馆副馆长段东升出席并作热情洋溢的讲话。国家档案局政策法规司司长郭嗣平,北京市档
本刊讯第十二次中华古都档案工作研讨会于10月13日至15日在北京举行,会议的主题是加强古都城市档案馆之间的合作,充分开发和利用馆藏资源,为古都城市经济和社会发展服务.国家
本研究采用了一组石油和沥青中的化合物-生物标志物作为天然示踪剂,其初步结果清楚地证明了这一点。
为氧化物的超导的性质被人工的神经网络(ANN ) 预言有是的结构、化学的参数的方法输入。预言的性质为杯率超导体为氧化物,为复杂氧化物的超导的转变温度(Tc ) 的分布式的范围,
期刊
USB作为一种数据传输接口,了解它的通信传输机制是正确利用USB进行数据传输的基础.分层次结构对USB数据传输模型加以分析,可以使读者建立起USB体系结构、通信模型和总线事务