基于搜索引擎的邮址搜集软件开发

来源 :电脑编程技巧与维护 | 被引量 : 0次 | 上传用户:ad5260
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在百度、谷歌等现有搜索引擎基础上,利用HtmlParser开源框架,用Java语言开发了一种基于搜索引擎关键字的邮址搜集软件.提取邮址的过程包括页面链接的获取和页面邮址的提取.在获取页面链接阶段,首先拼接初始链接,然后获取分页链接,之后再利用HtmlParser解析深层链接.在页面邮址提取阶段,则利用正则表达式匹配页面源码获取邮箱地址.
其他文献
目的 探讨开放性胫骨骨折内固定术后感染的危险因素和病原学分析。 方法 选取重庆市开州区人民医院骨科2010年1月—2017年6月收治的开放性胫骨骨折412例,根据是否发生术后感
基于潜艇被动声呐系统跟踪目标,进行目标运动分析后,发射线导鱼雷攻击水面舰艇的作战背景,建立了鱼雷导引方法、声呐目标分辨和目标运动分析的数学模型,通过仿真研究了鱼雷发
目的探讨人工气道建立时机对重型颅脑损伤患者肺部感染的影响及肺部感染的危险因素。方法选取2015年1月至2017年12月中国人民解故军联勒保障部队第九二二医院收治的110例重型