论文部分内容阅读
本文就是从爬行虫入手,着重讨论爬行虫初始URLs的形成,如果初始URLs集是个性化的(根据用户的兴趣进行选择的),则搜索结果也必定具有用户个性化的特点。本文依此目标,就初始URLs的获得、个性化搜索的实现作了一系列工作。
,本文实现了对关键词的概念理解,其主要思想就是通过关键词先找到类别,然后通过类别再找到相应的初始URLs集。比如想找计算机方面的内容,输入“计算机”和输入“电脑”所得到的类别就会是一样的——计算机,然后通过这个类别找到相应的初始URLs集。
本文还对网页搜索的个性化进行了实验,验证了这种方法的个性化特点。对于相同的关键词,不同的用户会有不同的初始URLs集,利用这一原理进行了实验,当输入关键词同为计算机时,用户A获得的是关于计算机教育和文化方面的网页,用户B得到的是计算机软件方面的网页。