论文部分内容阅读
如今,国内外对网站资源进行持续、大规模的采集活动开展了许多,这些项目都是根据一定的采集频率对整个因特网资源进行完整性或选择性的采集。然而由于网络资源的性质,使得这种方式遇到了许多困难:比如容易采错、重复采以及采不完全。鉴于此,论文提出基于合作式的网站资源采集系统模型,阐述了基于合作式采集的概念以及系统建设的背景意义。最后提出基于合作式的采集系统的框架设计以及采集的策略描述,以期对机构网站资源的长期保存有新的启示。