元搜索引擎结果个性化排序的研究与实现

来源 :中国石油大学(华东) | 被引量 : 0次 | 上传用户:wukai110032
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,搜索引擎存在着冗余信息过载和索引数据库信息覆盖率低的问题,发展个性化的元搜索引擎是解决这两个问题的一个重要途径,由于元搜索引擎可以同时调用多个独立搜索引擎,提高了搜索引擎的查全率;面对数量众多的检索结果,采用个性化的结果处理方法,可以提高用户检索的效率和返回结果的质量。本文研究并设计了一个针对元搜索引擎返回结果的个性化排序算法。算法的主要思路是将元搜索引擎返回的结果网页预处理后,通过聚类的方法,将结果网页集合划分为不同的类别。计算每个类别与用户兴趣模型的相似度,根据相似度对类别进行宏观排序,从而确定用户的兴趣类别,并对兴趣类别中的结果进行基于查询关键词与结果内容相关性的微观排序。文章中同时也给出了建立用户兴趣模型的方法和步骤。在个性化排序算法的结果预处理步骤中采用了一种改进的基于超链接文本分析的网页正文提取方法;在排序步骤中提出了宏观排序和微观排序的概念,给出了两种排序的具体实现方法;在聚类处理中,为了提高算法的性能,采用了一种改进的聚类算法。根据元搜索引擎结果个性化排序算法,本文设计了一个基于客户端的个性化元搜索引擎系统(PMS),系统采用了模块化的设计,具有友好的人机交互界面。文中给出了系统的测试数据,并对数据进行了分析和处理。实验表明,本文的基于个性化排序算法的个性化元搜索引擎系统(PMS)具有理想的查全率与查准率,能够达到方便用户检索和提供高质量检索结果的目的,同时该系统也存在着很多不足之处,有待于进一步的改进。
其他文献
声音媒体是除视觉媒体外最重要的媒体,随着可利用的多媒体资源迅速增加,如何对其进行有效的查找,已成为多媒体与信息检索技术一个重要的研究课题。在基于内容的音频检索技术
糖尿病引发的糖尿病性视网膜病变、肾脏及神经病变、心血管病变等并发症,严重威胁人类健康和生命。当前,地区医疗水平的差异,医院医生水平的差异,以及同一医生在不同条件下的
医学图像分割问题一直是图像处理领域中的经典难题。大脑组织具有特别复杂的结构,为了得到脑部病变组织的尺寸、外观的量化信息和实现脑部结构的三维重构,脑组织图像分割显得
本文首先概括介绍了项目管理系统的相关概念,其次介绍了J2EE技术和软件体系结构的发展和演变,并介绍了这些技术的特点。本文设计的项目管理系统采用J2EE的多层体系框架和MVC
随着我国经济建设的稳步发展,进入WTO的实现,政府机关、企事业单位如何提高内部管理水平,降低重复劳动,提升工作效率,提高服务标准,也成为众多单位领导不断思考和探索的问题
应急联动系统作为一种特殊的电子政务,已经成了城市现代化建设的标志。应急联动处理流程的研究是应急联动系统设计的基础,对系统处理流程进行有效的规划设计,充分考虑系统的
基于Internet/Intranet的网络视频监控系统作为第三代监控技术是当今网络监控系统的主流。通过网络实现多媒体远程监控已成为监控领域一个新的发展方向。其直观、方便、信息
科技是第一生产力,在石油工业尤为突出,对于石油开发与生产的方案部署、决策、降低成本、提高效益起着相当大的作用。由于地下的地质构造极其复杂,需要处理的数据量非常巨大,因此
微软公司新推出的Windows Vista操作系统在安全性方面做出了多项重大地改进。曾普遍适用于各种操作系统的缓冲区溢出漏洞攻击技术在Windows Vista以及.NET编译器的安全机制下
随着XML(eXtended Markup Language扩展标记语言)技术的快速发展,越来越多的数据使用XML进行表示,XML已经逐渐成为Web上数据表示和交换的标准。在电子商务等的应用中,参与交