基于LUCENE的群体个性化搜索引擎研究

来源 :武汉理工大学 | 被引量 : 4次 | 上传用户:a610735932
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Internet是一个高度开放、异构和分布式的信息空间,海量的信息杂乱地散布在全球各个站点上,而且每天都以极快的速度更新。随着互联网技术的发展和网络应用的日益广泛,Internet已经成为了人们获取信息资源和进行信息交流的一个重要途径。伴随着互联网的发展,Web信息也日益增长,如何从海量的互联网资料中找到自己需要的信息,成为了阻碍互联网发展的一大难题。虽然传统搜索引擎的出现极大地提高了网络信息的检索速度,在一定程度上解决了这个问题,但还是无法满足人们对信息服务日益增长的个性化需求。同时,在这个讲究个性和以人为本的时代,个性化和人性化的搜索引擎也成为了时代的需要,使得个性化搜索引擎成为了当前一个重要的研究课题。本文针对传统搜索引擎在用户个性化需求方面存在的不足,提出了一种全新的个性化理念,即群体个性化搜索。利用个性化信息采集系统收集和提取用户的个性化信息,通过扩展用户需求和优化搜索过程和结果,为用户提供个性化和人性化的信息搜索服务。本文所做的主要工作如下:1、首先简要介绍了Lucene这个主流搜索引擎应用工具的研究和应用,然后对当前主流个性化搜索引擎的相关原理及应用作了理论性介绍,重点对个性化信息的采集和更新进行了分析,为下一步的研究改进打下基础。2、针对个性化搜索引擎存在的不足和问题,提出了一种全新的个性化搜索引擎思想即群体个性化搜索技术。通过分析比较相关数据,对群体化搜索引擎的应用进行了可行性和服务性的分析。整体结构设计上采用客户端-服务器模式,对群体个性化搜索引擎进行系统实现,重点介绍了群体个性化搜索引擎几个重要模型的设计与实现,如用户模型的设计与实现,个性化查询扩展模块,个性化排序模块等。3、在系统实现的基础上,分别与传统搜索引擎及个性化搜索引擎进行了搜索结果比较,分析了群体个性化搜索引擎的优缺点。本文的研究内容将为个性化搜索引擎指出一个全新的发展方向,为搜索引擎的进一步发展提供一个新的理论平台和开端。
其他文献
在互联网环境下,海量的信息资源使得用户享受到科技带来的便捷,然而,近年来,信息过载问题已经在一定程度上开始影响用户对互联网应用的体验。如何能从繁杂的信息中筛选出用户
随着计算机网络的快速发展和普及,网络安全问题也变得越来越严峻。入侵检测系统作为一种主动的网络安全保障措施,它通过收集计算机网络中若干关键节点的信息并对其进行检测分
支持向量机(SVM)技术是由V.Vapnik于20世纪90年代中期提出的一种能处理非线性分类、回归等机器学习问题的新模型。近几十年其理论研究快速成熟,实际应用也被越来越多的领域重
步态识别是根据人的步态特征对人的身份进行识别的技术。步态作为一种新的行为特征,具有远距离、非接触性、非侵犯性、易感知性、难以伪装或隐藏等特点,并且是低分辨率情况下
主动服务是在Web服务的基础上发展而来的一种按需计算的新型计算模式。它为普通用户提供一种综合化、智能化、个性化的网络服务解决方案。根据用户的服务需求,从Internet或本
主动轮廓模型在计算机视觉、目标运动跟踪、医学图像识别等领域已成为一项研究热点,不同于Marr分层视觉理论,它是一种充分利用高层信息的图像处理过程,能够将图像分割、目标检测以及先验知识信息统一在一个框架中讨论的模型。高分辨率遥感图相比于普通图像,包含的信息量更大,强度不均匀,背景更复杂。利用传统的主动轮廓模型来解决遥感图像目标提取,容易产生目标边缘丢失、陷入局部最优等问题,因此有必要进行研究,通过改
随着网络技术的迅速发展以及先进软件平台J2EE的广泛采用,基于MVC开发模式的多层Web应用已成为主流,而相应的SSH(struts+spring+hibernate)框架也引起了学术领域和应用开发领
OpenSSL作为当前业界应用最为广泛的一套SSL协议开源实现,其高强度密码算法在SSL协议中的应用一直以来受到美国政府的严格限制。随着计算机技术的快速发展,基于常规密码算法
移动机器人是一种具有高度自规划、自组织、自适应能力,适合于在复杂的非结构化环境中工作的机器人。路径规划和安全导航技术是自主式机器人的研究核心,同时也是移动机器人实
随着计算机系统在宇航、气象、救灾、军事等各个关键领域的广泛应用,其可靠性和可信性日趋重要,一旦硬件系统发生故障,可能带来巨大经济损失,甚至影响人身安全和国防安全。同