【摘 要】
:
在经典PageRank算法中,页面的转移概率平均分配到链出页面,由于新网页的链接较少,其PR值普遍较低。经典PageRank算法通过链接计算PR值,未考虑到网页的内容,存在主题漂移现象
论文部分内容阅读
在经典PageRank算法中,页面的转移概率平均分配到链出页面,由于新网页的链接较少,其PR值普遍较低。经典PageRank算法通过链接计算PR值,未考虑到网页的内容,存在主题漂移现象。针对上述问题,引入网页权威因子和时间因子,通过网页按关键字检索后被点击的次数进行统计,根据其在初始排序结果中的位置对网页的PR值进行迭代修正,返回一个新的排序结果并分析网页内容,采用改进的TD-IDF算法解决网页相关性,避免主题漂移现象。仿真实验结果表明,改进算法可以提高网页排名的质量,使相关度较高的网页通过人们的自主选择获得不同程度的加权,获得加权的网页在检索结果中的排名得到提升,从而提高用户需求网页的查准率。
其他文献
以 6个水稻品种作完全双列杂交 ,应用包括基因型×环境互作的三倍体胚乳遗传模型及条件遗传方差分析方法 ,对水稻灌浆速率进行动态遗传分析。结果表明 ,不同类型水稻品种及其
<正>中医养生讲究天人相应,顺应四时,"春夏养阳,秋冬养阴"即为大纲。随着一阵秋雨一阵寒,现在已进入秋冬季节,秋冬进补的节奏已在如火如荼地进行中。中药养生保健尤其受到关
纵观国内外情报检索语言的研究,情报检索语言应具有以下功能:(1)网络环境下多数据库查寻中情报检索语言能够相互兼容;(2)易于使用;(3)能够联机显示。就网络环境中的情报检索
为探讨瘦素在奶牛乳腺发育、泌乳及退化各时期的表达变化规律及在乳腺组织中的具体位置,采用免疫印迹(western blot-ting)技术及激光共聚焦技术检测奶牛乳腺组织中瘦素及瘦素受
失业是现代市场经济运行的必然产物,但它的存在,又严重地影响到社会经济的发展和社会秩序的稳定。因此,建立和完善失业保险制度是社会稳定和国家长治久安的重要保证。当前我
选 18头 2 8日龄断奶、体重相近的大长北公仔猪 ,随机分为 3组 ,每组 6头于代谢笼中进行试验。按等氮等能的原则平衡各组日粮 ,基础日粮含 5 %的生大豆 ,对照组添加 1%谷氨酸
通过地质、地球物理、地球化学资料分析以及含油气系统模拟技术,对澳大利亚波拿巴盆地Petrel次盆未钻或少钻区域古生界3套页岩有机质演化过程进行研究。结果表明:二叠纪是石
以稻米加工副产品米糠为原料,采用单因素和正交实验确定了外添谷氨酸脱羧酶(GAD)制备γ-氨基丁酸(GABA)的最佳工艺条件:GAD酶用量175u/g,酶解时间2h,pH5.5,酶解温度45℃。经验证实验,在最
针对任意平面多边形域,采用增量思想和均匀网格,在局部范围内快速生成约束Delaunay三角形.该方法不会生成区域外的三角形;对存在折线、离散点以及含“洞”的情况不需要特殊处
通信三管塔有着用钢量较少、占地面积较小等优点,近年来得到了广泛应用,其安全可靠性受到普遍重视。因此,对通信三管塔安全可靠性研究的需求在日益加大。本文以40m三管塔为分