基于频繁链接的Web权威资源挖掘

来源 :复旦大学 | 被引量 : 0次 | 上传用户:danielliang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如何有效地利用Web这个巨大的信息库?传统的基于关键字的搜索引擎取得了一定的成绩,但是存在着查准率不高的问题.Web页面间链接结构事实隐含地表达着权威的信息,当网页的创建者在页面内向别的页面作链接时,某种意义上,在表达着他所链页面重要性的一种认可.于是,如何有效地利用链接结构来进行权威资源发现成为了信息检索研究者们的一个重要课题.而HITS、PageRank等相关算法的提出,更是坚定了人们对Web链接结构有效性的信心.到目前为止,链接结构在Web信息检索(包括搜索引擎)性能的改善方面,已取得了较好的效果,但依然存在很大的改善空间.为此,该文在对当前的Web做了充分的研究后,提出了FARMING(基于频繁度的Web图的权威资源挖掘)算法和SFP算法,以期用频繁模式挖掘原理挖掘相关于查询主题的Web权威资源.文章诠释了新的权威页面定义,提出了带阶的频繁子图和权威社团等概念,并用实验证实了FARMING算法的有效性.该文的最后对进一步研究和利用研究成果进行系统开发提出了今后努力的方向.
其他文献
分布式环境下RBAC的主要问题是如何在复杂的环境下高效、透明地实现用户-角色分配的逻辑全局性.给出了分布式环境下RBAC安全域的定义和构造,定义了安全域的偏序关系;在此基础
该文提出了一个基于异常的入侵检测系统—EAIDS,并实现了几种关于异常的检测算法.在EAIDS体系结构中采用了灵活的模块插件结构,具有秀强的可扩展性.目前系统支持两种类型插件
随着各行各业对图像的使用越来越广泛,图像信息资源的管理和检索显得日益重要。基于内容的图像检索(CBIR)技术的研究主要包括两个方面:可视化特征提取和相似性度量。其中研究的主
本溪钢铁公司二铁厂两个配料系统原来采用PC-700微机控制的电子秤进行自动控制.该文围绕着本钢烧结配料控制系统的技术改造,提出了相应的控制方案,详细地阐述了配料计算机控
流程工业自动化控制技术的发展,使得生产过程的底层自动化监视和控制逐渐完善。监控组态软件由于其稳定可靠,功能完善,易于使用等特点受到企业的青睐。由监控组态软件构建的监控
实时数据库系统中事务与数据都具有显式的定时约束,实时事务处理不仅要维护数据库的逻辑一致性,而且需要保证满足实时事务的各种时间约束,特别是实时事务的截止期.因此,系统
本文简要介绍了传统教育模式与现代教育模式之间的区别,阐述了开展网络多媒体教学的必要性,并分析了在现有硬件环境的基础上开发多媒体教学课件和网上考试系统的可行性。 论
该论文系统地介绍了作者在Web检索优化领域的研究工作.互联网是一个巨大的信息资源宝库,但互联网上大量的信息也给用户如何找到所需要的信息带来了很大的困难.在这种背景下,
图象的逆半调技术在许多典型的图象处理过程中有极大的实用价值.论文分析了半调过程和逆半调的发展与现状.研究了现有误差分散类逆半调算法的原理与技术.介绍了解决误差分散
为了满足未来对嵌入式Internet发展的需要,该文在基于32位ARM7处理器的eCos实时操作系统上设计与实现了嵌入式IPv6协议.由于eCos操作系统是一个可配置的操作系统,它要求系统