基于数据挖掘的Web权威页面搜索

来源 :中山大学 | 被引量 : 0次 | 上传用户:xiaofan8810060855
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当在因特网上搜索信息时,通常会使用基于分词的搜索引擎.这些搜索引擎返回内容与检索相匹配的网页集合作为检索结果.对于主题广泛的检索,返回结果往往包含大量与我们需求无关的数据.论文详细描述了一个所设计的搜索引擎结构框架,介绍了两种链接分析算法,然后针对目前这两种链接分析算法的不足,提出了一个改进算法.最后建立了一个测试用的搜索引擎,并使用抓取的网页对算法进行了详尽的检索对比,实验结果表明改进的算法在准确性方面比经典算法有很大的提高.
其他文献
我们正在见证一场将改变二十一世纪的数字革命,这场革命由因特网、媒体、信息、通讯等相关技术(ICT:Information and Communication Technologies)所推动。这场革命将彻底转
ARTs-OS是由华祥软件研究开发中心研制开发的一个嵌入式实时操作系统,进程管理模块是其中的关键所在,它的微型性、实时性、可预测性和可靠性是满足嵌入式实时数据库ARTs-EDB
作者对Win32平台下的进程迁移作了深入的研究.通过把进程迁移技术和分布式快照技术引入到MPI系统中,实现了对没有图形用户界面的进程的迁移,并且实现了一个支持这种进程迁移
作业管理系统是建立在操作系统之上的一类中间件软件,目的在于强化操作系统的批处理功能,提供对作业的提交、调度、执行及控制等机制,从而能够更加有效地利用系统资源、平衡网络
COBOL是Common Business-Oriented Language(公用面向商业的语言)的缩写,它产生于二十世纪六十年代。COBOL不断的演变并吸收计算机技术的进展,并在2002年产生了最新的2002标准
随着WEB2.0的兴起与高速发展,产生了大量的WEB信息,并被广泛地传播。目前,人类产生的信息正在以指数的速度增长,为了更好地利用这些信息,人们希望能迅速地从计算机得到对自己
表情是人与人交流中一种重要的传递信号的方式,自动识别人的表情在实际生产和生活中有着十分重要的作用,因此自动表情识别是计算机视觉领域的一个重要课题。本文使用纹理特征和
互联网技术的高度发展,为网络实体间的交流、合作带来的极大的便利,多个服务提供方联合起来为共有的用户群提供服务已经成为现实.在传统的网络协作模式下,要实现联合服务,管
本文对控制网络及开发控制网络系统的现状做了概述,结合“软件总线”+“软构件”的思想,提出了控制网络中的软件设备技术。即将控制网络中的所有硬件设备都映射为符合软件总线
信息技术的快速发展,对存储系统的容量和带宽都提出了更高的要求,单一磁盘已经远远达不到应用的要求,分布式网络存储系统已经成为存储技术发展的必然趋势。通信性能是影响分