简析搜索引擎的网络爬虫技术

来源 :科技视界 | 被引量 : 0次 | 上传用户:woshixiaomihu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文简析搜索引擎的网络爬虫技术,该技术是构成现代搜索引擎系统的重要组成部分之一。文章主要研究了图的遍历算法的两种方式:即广度优先算法与深度优先算法。在解决了互联网节点页面遍历的问题后,对网络爬虫中的重要工作——页面解析进行了具体的分析。
其他文献
患者,男,34岁,因右踝扭伤肿痛1h入院,查体:P85次/分,BP170/110mmHg,X片示右胫骨远端骨折、右踝关节脱位。既往有高血压病史3年余,自诉有局麻药过敏史,患者说不出具体是哪种局麻药过敏。
路面模量反演的修正迭代法是一种较为先进的路面模量反演方法,它通过预估模量初值、建立导数矩阵、修正模量值而得到较精确的路面模量终值。介绍了路面模量反演修正迭代法和国
介绍了医药工业洁净厂房的特点 ,分析了其火灾危险性及存在的问题 ,提出了在消防设计上应注意的事项 ,探讨相关消防技术对策。
对技术水平有限的(经济)黑客来说,如何通过"田忌赛马"式的组合攻击策略来实现"黑产收入"最大化呢?是否存在这种最优的攻击组合呢?本文作者借助股票投资领域中的相关思路和方法,