个性化的网页搜索研究

来源 :西华大学 | 被引量 : 0次 | 上传用户:greatbear1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  本文就是从爬行虫入手,着重讨论爬行虫初始URLs的形成,如果初始URLs集是个性化的(根据用户的兴趣进行选择的),则搜索结果也必定具有用户个性化的特点。本文依此目标,就初始URLs的获得、个性化搜索的实现作了一系列工作。   ,本文实现了对关键词的概念理解,其主要思想就是通过关键词先找到类别,然后通过类别再找到相应的初始URLs集。比如想找计算机方面的内容,输入“计算机”和输入“电脑”所得到的类别就会是一样的——计算机,然后通过这个类别找到相应的初始URLs集。   本文还对网页搜索的个性化进行了实验,验证了这种方法的个性化特点。对于相同的关键词,不同的用户会有不同的初始URLs集,利用这一原理进行了实验,当输入关键词同为计算机时,用户A获得的是关于计算机教育和文化方面的网页,用户B得到的是计算机软件方面的网页。
其他文献
计算机层析成像技术(CT)自上世纪60年代应用到实际中后,由于它检测精度高,重建的图像具有无影像重叠,空间分辨率和密度分辨率高,便于直接数字化处理与分析等特点,使得其在医学诊断
  下一代网络(NGN)是业务驱动、多网融合、开放灵活的网络,它实现了业务与呼叫控制相分离、呼叫与承载相分离,使业务真正独立于网络,用户不必关心与业务承载相关的底层网络知
计算机智能组卷和计算机自适应测验是都需要大型测验题库。题库建设离不开测验等值。本文在分析已有项目反应理论(Item Response Theory简称IRT)等值方法基础上,提出两种更为
计算机辅助设计(CAD)作为一项在工业界得到广泛应用的信息技术,它推动了几乎一切领域的设计革命,CAD技术是实现数字化设计的必不可少的手段。而三维CAD技术则是当前和未来CAD研
近10年来,IP业务呈爆炸式的增长趋势。IP计费一方面是正常运营IP业务的基本条件之一,另一方面也是为用户提供稳定的、保证服务质量的网络环境的基础。目前普遍认为下一代IP网将
随着软件技术的不断发展,开发者和用户对于软件质量提出了更高的要求。为此,软件开发者试图从技术、管理等各层面控制软件开发过程,从而提高软件产品的针对性和可靠性,保证软
最近几年,大规模多处理器系统在计算领域起到了越来越重要的作用。但是,随着处理单元的增多,系统部件出错的可能性也随之增加。为了得到系统的高可靠性和高可用性,系统级故障
网格系统的目标是实现大量异构资源的共享。由于网格资源具有动态性、异构性、分布性和自治性等特点,网格系统中资源分配已经成为了关键问题。经济学原理与传统的资源分配算
电子政务是指政府机构使用信息技术(比如互联网和移动计算),赋予政府部门以独特的能力,转变其与公民、企业、其他政府部门之间的关系。电子政务系统是使用Internet技术,向公
本文设计并实现了一个椭圆曲线密码引擎。整个系统分为协议模块、椭圆曲线运算模块、对称密码模块、数字摘要模块、密钥数据库模块、密钥导出模块和密钥管理模块七个部分。文