基于超链接分析的网页排名算法研究

来源 :中山大学 | 被引量 : 0次 | 上传用户:carlos_yu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网页排名是互联网搜索中至关重要的课题。自从经典的PageRank和HITS算法的提出并分别应用到Google和IBM实践中取得非常好的效果后,基于超链接分析的网页排名算法成为了网页搜索的核心。本文回顾并剖析了经典的超链接分析网页排名算法,包括PageRank、HITS、SALSA、HubAvg算法。同时,本文阐述了超链接排名算法的研究框架,即把此类算法看成从n个结点的有向图到”维实值向量的算子,其中输出向量的各个分量分别表示n个结点的权威值,最后按照权威值得到网页结点的排名。在此框架下,分析了算法的相似性以及稳定性。 本文在现有的算法基础上提出了两大改进。首先发现了HITS和HubAvg算法在处理多连通分量的超链接关系图时,忽略了整个关系图的整体结构,各个连通分量之间权值和评价无法相互传递或者比较,导致最后输出结果存在偏歧。针对这一问题本文提出了带连通分量的HITS和HubAvg算法,并通过实际网络数据作实验比较,证明改进算法对网页评价更平均更公一正。第二个改进是基于PageRank算法的点击率分布算法。PageRank模拟用户浏览网页的随机过程,但是把用户随机选择新网页作新浏览的步骤看成对网页是等概率分布的,然而从实际中看往往并不如此,本文建议以点击率确定新的概率分布,以更接近用户的行为习惯。这更符合实际,因为用户在选择网页开始新浏览确实是有个人偏好的。
其他文献
本文主要研究了具有不定号次线性项的椭圆方程Dirichlet问题变号解的存在性及多解性,和热方法及其在具有不定号超线性项的椭圆方程Dirichlet问题中的应用. 第二章研究了具有
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
全球化的不断发展,引发了人才的国际化需求,而这又推动了高等教育国际化的进程.作为人才培养基地的高校,如何推进国际教育的交流与合作,实现教育资源的优化配置,是一个引人思
宇四浜村紧临嘉兴市区,交通便利,区域位置优越。全村共有333户农户,总人口1182人,共有水田2407亩,旱地786亩。2003年农村经济总收入2187万元,农民人均纯收入5710元,自来水入
本文在查阅了大量的原始文献和有关研究文献的基础上,利用文献分析研究与数学史比较研究方法,系统地分析与研究高斯的内蕴微分几何学思想与高斯的非欧几何研究之间的内在联系。
学位
对于广义序空间X和Y,我们在字典序乘积X×Y上引入了新的拓扑.这个字典序乘积上的新拓扑不仅包含通常的开区间拓扑,而且是开区间拓扑的自然推广.最近,Matveev引入单调Lindel(o)f的
本文主要应用Hopf分支理论来研究人类呼吸系统的Hopf分支.首先,通过分析系统关于平衡点的线性变分方程的特征根来研究系统在平衡点的稳定性,并应用局部Hopf分支定理研究了系统局
本文主要考虑了基于捆绑销售策略下的易腐食品库存管理模型。我们根据消费者对于不同货架期的易腐食品的心理价位不同,将同种易腐食品看成两种不同的产品:新鲜品和陈旧品。把处
本文主要对一些整函数的高斯积分平均的对数凸性进行了讨论.设z= peiθ, p=2,a=1,首先讨论了当f(z)=z2+Bz+C时,函数r→lnM2,1(f,r)对 Inr的凸性,其次我们分别讨论了f(z)=a+zf(z
《雾凇》这篇散文,描绘了吉林雾凇瑰丽而奇特的景象及其形成原因,语言生动、精练,富有韵律美,适于朗读.教学中,我以“读”为贯穿始末的主线,同时突出习惯培养和口语训练,以彰