网络爬虫技术在搜索引擎中的应用

来源 :全国第21届计算机技术与应用(CACIS)学术会议 | 被引量 : 0次 | 上传用户:yanweiwch
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当今互联网飞速发展的今天,搜索引擎技术日益提高.如何从海量的万维网网页中以何种策略找到自己所需的信息成了搜索引擎中网络爬虫研究的主要问题.网络爬虫是将万维网上的网页通过抓取程序自动提取出来,它的工作机制是为搜索引擎从万维网上下载和抓取网页,是搜索引擎的重要组成部分.本文介绍了网络爬虫的分类和主要工作原理,并分析了搜索引擎的发展趋势.
其他文献
她不是时装模特,但她的着装总是那么得体、大方;她不是服装设计师,但经她选定、裁制,哪怕稍加修饰的服装总是那么格调高雅,引人注目;她不是有着充裕时间操持内务的家庭主妇,
植物在自然界里,因所处的环境复杂,经常会遇到不良环境条件的剧烈变化。但它们具有一定的忍受能力,渐渐形成了适应不良环境的本领。植物的抗寒性就是一种与不良环境作斗争的
瑜伽的会员课,是由冥想、体位和瑜伽休息术三个环节组成的。在初级会员的瑜伽课上,冥想也许是最不被欢迎的一个环节,很多会员都会问我:“教练,我们为什么要冥想?”在一些不够
充分利用多核处理器的多级缓存以减少在求最大和子序列时访问主存的次数和缓存缺失;采用数据分块技术,使每个处理核心的负载平衡;采用增加元素存储间隔来避免多个线程读写缓
本文针对校园网目前存在的安全隐患,提出了利用分布式入侵检测技术构建校园网的安全防范方案,通过设置边界传感器、主管传感器、中央控制台三层检测体系,来检测校园网络上发
40多年前,一场纷纷扬扬的雪花给“塞上江南”的宁夏平原披上了银白色的盛装,一个男童的哇哇坠地,给他的世代以农为业的家庭平添了节日的欢乐。也许是滔滔的黄河水、绵延的贺
AODV协议是Ad Hoc网络中典型的反应式路由协议.该协议仅适用于双向传输信道,路由表仅维护一条到指定目的节点的路由,而这个过程会增加传输时延,所以对于AODV协议的改进是必要
在一个没有摄影、不可能为君王随从写真的年代,作为官方正式画像,委拉斯贵兹的宫廷画表现出一种纯粹的美,使后人无法妄加论断。这幅作品是委拉斯贵兹1656年创作的,刚完成时名
日志记录着网络运行过程中重要的事件信息,通过对日志进行分析,发现所需事件和规律是安全审计的根本目的.本文通过对已有的网络安全对策的分析,提出了一种新的网络安全日志审
Ad hoc网络是一种完全由无线连接的可移动节点所构成的网络,与无线网络(wLAN)一样,面对各种可能的攻击和安全威胁.本文提出通过定义Ad hoc网络模型的关联性程度,划出安全控制