论文部分内容阅读
目前,我国的网页数量已经达到三百多亿,并且正以年增长率超过百分之百的速度飞速增长。为了从众多的网页中快速高效准确地找到需要的信息,主题爬虫孕育而生,它从网络上选择用户需要的主题信息下载,为用户提供庞大的数据信息支持。本文研究可定制关键词(即主题)的基于.NET的更加精准有效的网络爬虫的设计和实现。通过实验及实际应用验证,该爬虫的精准率大大高于普通的爬虫。