一种基于自动WEB数据抽取生成黄页的方法

来源 :微计算机信息 | 被引量 : 0次 | 上传用户:lxl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
利用蜘蛛技术爬取相关行业网站的数据。通过基于一种基于新的定位与模式匹配抽取WEB数据的方法,将得到的数据分类后以XML文件保存;通过相应的信息处理、表现技术对分类后的行业URL地址进行展现。最后以林业行业网址的获取和黄页的生成为例进行了实现。
其他文献
市委、市政府作出的建设一小时经济圈的重大战略部署,为加速大足经济社会发展带来了重大历史机遇。为此,大足将围绕“发挥直辖优势、实现科学发展”主题,采取更加开放的措施,全面
研究了在静态环境条件下AUV(自主水下机器人)全局无碰撞的路径规划方法。提出运用顶点图像法建立环境模型,然后利用改进的微种群遗传算法得到一条从起点到终点的安全、无碰撞地
节点的数据传输控制协议一直是水下无线传感器网络(UWSN)协议研究中的薄弱环节。由于水声信道具有高时延,高误码率,时延多变等特点使得高效,可靠的节点传输控制协议设计较为困
继重庆市被国家批准为统筹城乡综合配套改革试验区后,垫江县被市委、市政府确定为市级统筹城乡综合配套改革示范县。面对这一千载难逢的历史性机遇和先行先试的重大责任,垫江县
论文提出了一种基于遗传算法的Web Services组合优化方案。遗传算法采用集合节点和二进制编码相结合的方法对Web Services组合空间进行映射,缩小了算法的搜索空间,缩短了算法
【正】 经济体制改革的一项重要内容,就是要正确处理国家与企业的关系,在实现整个国民经济的统一性和计划性的前提下,充分发挥各个企业的独立性和主动性,不断提高宏观的和微
对农业劳动力转移与农业持续发展的探讨陈雩桢,拉叶建平研究农业劳动力转移与农业发展的阶段特征,探索农业剩余劳动力转移的步骤、途径,提出确保农业持续发展的对策建议,对指导农
“农转非”是工业化与城市化建设的必然产物。重庆北部新城正在崛起,背后有许多农民做出了巨大的牺牲和贡献,他们是值得尊敬和关注的。原本以土地求生存的农民,变为城市居民之后
数据库存取主要依赖建立索引来进行数据存取优化,但增加索引也有许多不利的方面。为此本文将根据蚁群理论寻找一种不建立索引的方式来优化数据存取,一方面可以减少存取时间,
全面推行“乡管、村记、社报帐”办法苍溪县东溪区借鉴外地先进经验,从今年开始,全面推行农村合作经济组织财务帐目“乡管、村记、社报帐”的制度,搞好农村合作经济组织的财务管