基于页面Block的Web档案采集和存储

来源 :软件学报 | 被引量 : 0次 | 上传用户：a306783805

【摘要】

：

提出了基于页面Block对Web页面的采集和存储方式,并详细表述了该方法如何完成基于布局页面分区、Block主题的抽取、版本和差异的比较以及增量存储的方式.实现了一个Web归档原

【作者】

：

宋杰王大玲鲍玉斌申德荣

【机构】

：

东北大学信息科学与工程学院

【出处】

：

软件学报

【发表日期】

：

2008年02期

【关键词】

：

Web档案页面分区页块

【基金项目】

：

Supported by the National Natural Science Foundation of China under Grant Nos.60573090, 60673139 (国家自然科学基金)

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

提出了基于页面Block对Web页面的采集和存储方式,并详细表述了该方法如何完成基于布局页面分区、Block主题的抽取、版本和差异的比较以及增量存储的方式.实现了一个Web归档原型系统,并对所提出的算法进行了详细的测试.理论和实验表明,所提出的基于页面Block的Web档案(Web archive)采集和存储方法能够很好地适应Web档案的管理方式,并对基于Web档案的查询、搜索、知识发现和数据挖掘等应用提供有利的数据资源.

其他文献

基于城市竞争力的城市经营理论研究

法国历史学家费尔南·布罗代尔认为，市场经济的拓展是传统社会向现代社会转变的基础，而构筑市场经济的货币与城市是引起变化的发动机和显示器。城市具有集聚和扩散经济优势，拥有

学位

城市经营城市竞争力城市治理城市营销

协同过滤算法在电影推荐系统中的应用

在大量电影中如何快速找到自身所喜爱的影片是一个很重要的问题,特别是在观众没有明确目标时,推荐系统则可发挥至关重要的作用。结合电影推荐系统的实际需求,通过阐述和分析

期刊

协同过滤数据稀疏电影推荐系统

视频编码标准H.264及其快速实现算法研究

H．264／AVC是由ITU-T的VCEG(视频编码专家组)和ISO的MPEG(运动图像专家组)共同制定的新的视频编码标准。H．264使用很多先进的视频编码方法，与现有标准相比，它可以获得更高的压缩性

学位

H.264/AVC帧内预测整数变换零块预先判决SIMD(单指令多数据流)

公司金融——股利政策理论研究

由于我国证券市场的不断完善和成熟以及越来越多公司的上市,公司的经营决策者面临着越来越多的与股利分配有关的财务问题。因此,股份公司迫切需要科学、系统和实用的理论研究

学位

股利分配￡行为金融投机心理模型

四氟乙烯/全氟丙基乙烯基醚分散共聚和共聚树脂结构/性能关系研究

四氟乙烯一全氟丙基乙烯基醚(TFE-PPVE)共聚树脂具有类似聚四氟乙烯的耐腐蚀、耐高低温等优异性能,同时克服了聚四氟乙烯难加工的的缺点,是一种新型的含氟塑料。论文针对国外

学位

四氟乙烯全氟丙基乙烯基醚分散共聚聚合动力学共聚物组成

教育技术与教师队伍建设

现代教育技术在教育教学中的广泛运用,对教师的职业素质提出了严峻的挑战——教师在信息社会的教育中将会是一个什么样的角色?应当具备什么样的素质要求?应当如何去主动适应

期刊

现代教育技术教师形象地位变化教师队伍建设

论中小学教师信息技术能力培训

就目前中小学教师信息技术能力培训中存在的问题阐述了自己的看法与观点:培训对象起点差异较大是开展培训工作的主要困难;缺乏相应的激励机制和评价标准是导致培训不受重视的

期刊

中小学教师信息技术能力培训

基于数字水印的图像认证技术研究

在付出了昂贵的代价之后，人们才发现一个环节的滞后往往会导致整个产业举步维艰。计算机网络为多媒体信息交流和交易提供了平台，却没有提供有效的安全保障，网络信息特别是多媒体

学位

网络安全数字水印数字签名图像认证二值文档图像色调处理图像边缘恶意攻击偶然操作感兴趣区域可逆信息隐藏灰度直方图提升小波变换

瑞芬太尼的药理学和临床应用

瑞芬太尼 (remifentanil)是最新的 μ阿片受体激动剂 ,药效强 ,起效迅速 ,剂量容易控制 ,安全可靠。该药是哌啶的衍生物 ,因含有一个酯的结构 ,极易被体内酯酶迅速水解。对循

期刊

瑞芬太尼静脉内麻醉μ阿片样受体药理学

新型血小板P2Y12受体拮抗药

抑制ADP诱导的血小板聚集的药物(如氯吡格雷)已成为目前心血管领域内最重要的抗血小板药物。但氯吡格雷起效较慢,抗血小板作用相对较弱,尚有一定的低反应者和无反应者。普拉

期刊

血小板聚集血小板聚集抑制剂氯吡格雷普拉格雷

基于页面Block的Web档案采集和存储

与本文相关的学术论文