一种Deep Web聚焦爬虫爬行策略

来源 :微电子学与计算机 | 被引量 : 0次 | 上传用户:voolxu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
实现大规模Deep Web数据源集成是方便用户使用Deep Web信息的一种有效途径.Deep Web爬虫是Deep Web数据源集成的关键组成部分.提出一种针对结构化Deep Web的聚焦爬虫爬行策略.通过对查询接口的特征分析来判断Deep Web数据源的主题相关性.同时,在评价链接重要性时,综合考虑了页面内容的主题相关性和链接的相关信息.实验证明该方法是有效的.
其他文献
差分电磁攻击是一种针对密码算法的侧信道攻击方法.根据CMOS器件工作时产生发射辐射的原理,建立了针对DES加密算法的电磁侧信道攻击平台;对差分攻击方法和电磁辐射分析进行了说明;结合虚拟仪器技术,采用磁场探头对单片机的电磁辐射进行测量,获得了较好的信号;利用针对多CPU的优化算法,实现了在1000组样本量下快速破解DES加密算法,整个实验过程在半小时内完成.
提出了一个基于情境的Web服务安全模型,该模型通过定义高层次的策略规则,Agent能在不中止Web服务运行的情况下动态控制用户的访问.通过对用户及Web服务的情境信息的收集和管
产业结构是国民经济各产业部门之间以及各产业部门内部的构成。一国或地区的经济增长是在产业结构的不断调整中实现的。本文就延边州存在的问题,在借鉴其他民族地区发展经验
开发了一个基于XML的数据管理系统XDMS,真正实现了在数据层使用XML对数据进行结构化设计和存储,实现了系统数据的集成共享,提高了系统的整体效能.首先给出了系统设计的整体方
从苏格拉底开始,人的主体性观念得以正式确立.随着文艺复兴的兴起,人文主义思潮获得了空前的发展,人自身的价值被大大褒扬了.可是,就在人的主体性得以确立和获得发展之时,人