基于网络爬虫和改进的LCS算法的网站更新监测

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:asdfsadfsad
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网时代,信息爆炸式增长,用户需要方便及时地获取自己所需的信息。传统的搜索引擎和以RSS为代表的订阅具有一些缺陷,难以满足用户高质量需求。在此基础上,利用网络爬虫和文本对比,提出一种新型网站更新监测与订阅的通用方法。该方法将先后抓取的网页内容分析处理后,进行文本对比,检测更新内容,将结果以结构化形式返回给用户查看。实验表明,该方法解决了RSS订阅受订阅源限制的缺点,实现了用户添加任意网站,在高校、企业、新闻、电影、博客、论坛等网站的监测方面具有较好的效果。
其他文献
本文对玻璃钢手糊成型工艺及其产品质量的一些理念问题,结合作者多年来专业工作实践,综述了关于提高与保证手糊玻璃钢产品质量的重要因素及简明公式,也即人品(素质)+技术=产
在大数据时代下旅游业的发展和转型升级,为智慧旅游的发展创造了有利的契机。本文通过对旅游大数据在智慧旅游中的应用以及发展面临问题进行分析,对大数据下智慧旅游的发展提
逯钦立先生用半生心血浇注的135卷《先秦汉魏晋南北朝诗》,是目前网罗最富、校勘最精、为学林盛赞的先唐诗歌总集。然因时代跨度巨大,搜罗范围广泛,其中难免存在着一些疏漏与
全面建设小康社会是党长久以来的奋斗目标,建设小康社会需要建设起完善的社会保障体系,然而我国多年来在发展过程中,过于重视城市的发展,忽视了农村的发展,导致城乡发展差距
车用驱动电机作为电动汽车三大核心零部件之一,是电动汽车的'心脏'。驱动电机的重要性凸显无疑。为提升功率密度,驱动电机已经逐步向高转速的方向发展。针对高转速电