美国网页归档项目发展的新动向

来源 :档案与建设 | 被引量 : 0次 | 上传用户:augenthaler
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:美国国家数字化管理联盟的网页归档项目调查报告已成为一些机构制定网页归档政策时的重要参考之一。文章通过分析美国国家数字化管理联盟2016和2017两年的网页归档项目调查报告,并与2011和2013年调查结果相比较,探索了美国网页归档项目发展的总体特征,总结了美国网页归档项目在建设主体、实施内容以及开发利用方面的发展新动向,并在此基础上对我国网页归档实践的发展提出了一些思考与建议。
  关键词:NDSA;网页归档;调查
  分类号:G275
  美国网页归档实践的领先发展一直为我国众多学者所关注。总的来说,国内相关研究多是聚焦于一个或多个美国重点网页归档项目的案例分析,鲜有文献对美国网页归档项目发展的总体进行研究。2010年,美国国会图书馆宣布成立国家数字化管理联盟(National Digital Stewardship Alliance,NDSA)。该组织分别于2011、2013、2016和2017年共计四次开展了美国全国性的网页归档项目调查,其中最新的2017年调查报告已于2018年10月对外公开。调查涉及网页归档项目的建设主体、归档范围、归档方法、版权与隐私、访问与利用等五个不同方面。这四次调查既对美国网页归档项目不同阶段的总体概况进行了记录,又追踪了美国网页归档项目在过去几年内的变化。调查所形成的报告指明了美国网页归档实践的未来走向和发展机遇,最新的调查还发现,这些报告已被部分美国机构作为制定网页归档政策时的重要参考之一。
  同时NSDA的调查报告也为我国相关领域跟踪和研究美国网页归档项目的总体发展特征提供了契机。国内学者蔡舜在《美国网页存档调查及启示》(以下简称“蔡文”)中着重对NDSA2011年和2013年的调查报告进行了介绍与分析。鑒于美国网页归档实践在不断发展的这一事实,近年必然会出现值得我们持续关注的新动向,因此我们在蔡文研究的基础之上,聚焦NDSA2016和2017年的调查报告,试图揭示美国网页归档项目在建设主体、实施内容以及开发利用方面的新动向,以期对我国网页归档实践的未来发展提供一定的借鉴与思考。
  1建设主体的动向
  NDSA的调查对象包括但不限于联盟的成员机构,2016年和2017年NDSA分别收到104个和119个美国机构的有效调查结果。2017年参与调查的机构数较2013年增加了1/3,除开展网页归档项目的机构数量在不断增长外,美国的网页归档项目在建设主体方面还出现了以下变化。
  1.1高校成为发展的主力军
  美国网页归档实践已进入快速发展时期,近十年美国开展网页归档项目的机构迅速增加。2017年调查报告显示,仅2016年后启动网页归档项目的机构就占了全部调查对象的1/4。而这一趋势的出现与高校的积极参与是密不可分的,具体表现在:与前两次调查相比,开展网页归档项目的政府部门及其他类型机构的数量变化并不大,而高校的数量则呈现出明显增长,占全部调查对象的比例超过60%。高校已成为美国开展网页归档项目的主阵地,其次是政府部门和公共图书馆。网页归档项目在高校内的活跃程度,说明网页归档已经成为美国高校图书档案机构资源建设的重要途径。
  1.2机构合作推动项目建设
  网页归档的挑战不是任一机构可以独立解决的。调查中曾有机构表示:“作为一个中小型大学……我没有资源(或专业知识)去实现高水平的、前沿的发展。提到工作流程,我还要考虑员工时间不足的问题——虽然我希望实现更好的质量保证和元数据描述,但是这不是我们的首要任务。”NDSA也在《2014年国家数字管理议程》(National Agenda for Digital Stewardship 2014)中提出,不是每个机构都能为网页归档的所有活动提供全部资金,要求每个机构在网页归档的各个方面拥有专业知识也是不切实际的。但是不同的机构可以专注于不同的方面,并相互依赖某些职能,通过合作促进网页归档实践的发展。
  NDSA调查发现,2013年仅有18%的机构表示自己参与过合作,这一比例在2017年则增长为57%,而机构间合作的加强与2013年以来推出的一系列网页归档合作计划紧密相关。NDSA也在报告中认可了常春藤图书馆联合会的“网页馆藏计划”(Web Collecting Program)、加利福尼亚数字图书馆的“Cobweb”、“联邦网页归档工作组”(Federal Web Archiving Working Group)等网页归档合作计划的积极作用。2013年常春藤图书馆联合会开始“网页馆藏计划”,建立了常春藤联盟各大学图书馆间网页馆藏建设的合作关系;2016年加利福尼亚数字图书馆联合哈佛大学图书馆、加州大学洛杉矶分校图书馆,推出网页归档协作平台“Cobweb”:2014年美国国家档案与文件署、美国政府出版局、美国国会图书馆等以“联邦网页归档工作组”形式开始联邦政府网页归档合作。这些都是网页资源馆藏建设的不同合作形式,通过机构间的协作和资源共享,吸收了来自不同机构的不同资源,推动了网页归档项目建设的快速发展。随着现有网页归档合作计划的不断推进及新的网页归档合作计划的推出,参与合作的机构将会越来越多,网页归档合作的参与方式也会越来越丰富。
  1.3公共图书馆成为新生力量
  在2011、2013和2016年的调查中,公共图书馆在全部调查对象中的占比一直不足3%,2017年公共图书馆占比增长到13%,仅次于高校和政府部门。这一变化得益于2017年互联网档案馆启动的“社区网页:助力公共图书馆员创建社区历史网页档案”(Community Webs:Empowering Public Librarians to Create Community History Web Archives)项目。“社区网页”项目由互联网档案馆主导,博物馆和图书馆服务研究所提供资金支持,在线计算机图书馆中心提供技术指导,皇后区公共图书馆、克利夫兰公共图书馆和旧金山公共图书馆提供人力资源,共同为15个不同的公共图书馆提供技术培训、人员支持和网页归档服务,帮助他们提高网页归档的技术与能力,以创建记录当地记忆、有历史意义的网页资源库。   公共图书馆以所在社区相关网页为起点开始网页归档实践,通过机构间合作,汇集和利用了多个机构的资源和专业知识,不仅推动了网页归档被纳入馆藏建设的正式活动,对社区数字记忆的长期保存也有着重要意义。不仅如此,“社区网页”项目在保存社区历史网页档案的同时,对公共图书馆的技术培训还将产出一系列开放的网页归档与数字保存相关的教育培训资源,供其他有兴趣开展网页归档项目的机构及其人员参考,既有利于吸引其他机构的参与,也在一定程度上推动了美国网页归档培训的步伐,是美国网页归档实践专业化发展的重要体现。
  2实施内容方面的动向
  从2016年调查开始,NDSA引入了Archive-It推出的网页归档生命周期模型(The Web Archiving Life Cycle Model)。该模型认为政策涉及网页归档的方方面面,网页归档中的高层决策可分为愿景与目标、资源与工作流程、访问/利用/再利用、保存、风险管理,而网页归档的日常任务可分为鉴定和选择、归档范围界定、数据捕获、存储和组织、质量保证与分析,元数据描述则是贯穿整个网页归档的持续过程。它概括了通用的网页归档工作流程,为机构开展和改进自己的网页归档项目创造了一个可测量的模型,本文也将以此为参考,对美国网页归档项目实施内容方面的动向进行分析。
  2.1归档范围向内部网站倾斜
  机构在决定归档哪些网站的内容时主要有两个选择:一是归档自己或附属网站的内容作为机构记录的一部分;二是归档其他机构或个人的网站内容以便未来研究。随着网页归档作为机构信息资源管理的正式活动得到越来越多的认可,机构也愈加倾向于归档自己或附属网站的内容作为机构记录的一部分,内部网站成为网页归档的主要内容。据2017年调查,对内部网站进行采集的机构较2011年增加了17%,而对外部网站进行了采集的机构则明显减少,较2011年低了24%。不论是采集内部网站还是外部网站,机构的归档能力在整体上有了很大的提升。机构对采集音频、视频、博客、数据库、社交媒体等类型资源的信心均有所增强,同时对采集互动式多媒体的顾虑则加深了。
  2.2数据捕获借力外部工具和服务
  机构网页归档能力的提升与网页归档工具和服务的发展与进步息息相关,利用外部服务商实现网页归档成为机构首选。2017年有87%的机构使用了网页归档服务,其中Archive-It是最受欢迎的网络资源归档服务,使用率从2013年的71%增长为2017年的94%。使用网页归档工具进行本地网页采集的机构数量相对稳定,占全部机构的30%左右,四次调查的结果相差不大。自2011年NDSA开始调查以来,网页归档工具Heritrix和HTTrack一直深受机构欢迎,机构使用率始终排在前列。Heritrix采用广度优先算法,可实现大规模网站网页信息的完整采集;HTTrack有较强的链接分析功能,适合重要网站网页信息的深度采集。2017年Webrecorder发布仅一年就跃居前两者之上,成为机构使用率最高的网页归档工具。Webrecorder是基于浏览器的网页归档工具,可以捕获传统的基于链接的Heritrix和HTTrack难以采集的网页。
  2.3关注归档网页的质量問题
  2016年开始,NDSA以Archive-It网页归档生命周期模型为参照,对机构当前在网页归档项目上取得进展最多和最少的领域进行了调查。从结果上看,数据捕获、鉴定和选择、归档范围界定在2016和2017年的调查中一直是机构取得进展最多的领域之一。相反,访问/利用/再利用、元数据描述、质量保证与分析则是机构认为自己取得进展最少的领域。这说明当前各机构在确定捕获什么以及如何捕获它们方面,也就是网页生命周期的前期取得了很大进展,但是在网页归档生命周期的后期,美国网页归档项目的推进较为缓慢,机构仍有很多问题需要解决。
  调查结果也显示,归档网页的质量问题已经引起了机构的关注与重视。NDSA对机构在发展网页归档项目时首要考虑的因素进行了调查,其中选择数据量的机构则从2013年的53%减少到2017年的29%,而选择质量的机构则从17%增长到51%。NDSA将“质量”定义为完整性、准确性和重现保真度,这也就意味着机构越来越关注是否将原始网页完整、准确地进行归档,以及归档网页能否重现网页最原始的样子。机构对归档网页质量的关注在一定程度上印证了美国网页归档项目在逐步走向成熟。机构也表示有兴趣在质量保证技术和策略、捕获配置和优化、元数据标准和应用等领域开展合作。但是质量保证在过去十年中技术进步缓慢,还需要机构投入更多的关注和资金来开发有着更高可靠性的工具。
  2.4版权相关政策仍待加强
  网页归档项目的进行不可避免地会遇到知识产权问题,机构在制定项目计划时,会考虑自身愿意接受的与版权相关的风险级别及如何管理这种风险,这主要体现在版权相关的政策中。2011和2013年的调查显示,机构在开展网页归档项目时缺乏从内容创造者处申请许可的明确政策。这与机构倾向于内部网页归档有直接关系,但是在外部网页归档时机构也缺乏相应措施。这种情况在2017年并没有改善,71%的机构在采集时没有申请内容创造者的许可,75%的机构在提供归档网页资源的访问时也不会告知内容创造者或寻求许可。随着机构越来越关注内部网页归档,这一趋势可能会继续。但乐观的是,2017年NDSA首次调查了机构在没有许可的情况下是否收到过内容创造者提出的停止采集或删除内容的要求,91%的机构表示没有收到过。正因内容创造者的不追究,放纵了机构在外部网页归档时的不作为。
  3开发利用方面的动向
  随着机构将目光转向网页归档生命周期后端,不仅质量问题得到机构重视,归档网页资源的开发利用也受到机构越来越多的关注。
  3.1开发利用意识加强
  调查中,认为访问和利用是发展网页归档项目重要因素的机构比例从2013年的40%增长为2017年的70%。NDSA将“访问和利用”定义为包括研究人员互动、网络分析及利用案例等在内的概念。进一步的调查发现,2017年仅有18%的机构表示有研究人员活跃地使用他们项目的归档网页资源,更有33%的机构明确表示没有研究人员正在使用,大部分的机构并不知道研究人员的利用情况如何。即使部分机构肯定已归档网页有研究人员正在使用,但是据调查,这些机构主要是通过谷歌分析等工具实现利用情况跟踪的。然而这些工具只能跟踪网页的访问数据,这些数据并不能直接转换为研究人员实质性利用的数据。美国网页归档项目的开发利用现状并不乐观,备机构在关注网页归档项目发展的同时,仍需积极采取措施应对。NDSA认为随着“Archive-It研究服务”(Archive-It Research Serv-ices.ARS)、“档案释放工具包”(Archives Unleashed Toolkit,AUT)、“继续教育推动网页归档”(Continuing Education to Advance Web Archiving)等有益措施的不断推进,在未来的调查中,网页归档项目的开发利用情况或许会有所不同。   3.2创新提供利用方式
  机构在依赖网页归档服务进行数据捕获的同时,提供的归档网页利用方式也深受其影响。被广泛使用的Archive-It不仅提供全文搜索和浏览列表等多种检索方式,还可以将托管的网页档案集合直接链接到机构本地的搜索页面。同时Archive-It也在积极探索新的提供利用方式,并于2015年3月宣布推出Archive-It研究服务。在此之前,Archive-It提供的网页档案访问方式主要是基于搜索和浏览的,用户通过点击一次只能研究一个网页,和浏览实时网页是一样的。ARS则引入了新兴的数据驱动研究方法,如网络分析、文本与数据挖掘、纵向内容分析等。Archive-It希望通过ARS扩展研究人员、学者及用户访问和分析归档网页资源的方式,增加网页档案的利用率。“档案释放工具包”的开发思路与ARS类似,AUT是档案释放项目(The Archives Unleashed Project)推出的包括网页归档服务和网页档案分析在内的一站式平台,不仅可以实现网页存储、元数据管理和知识提取,还提供了强大的数据处理和分析工具。
  3.3提升服务人员技能
  ARS和AUT是将网页归档分析工具嵌入网页归档服务平台的有益尝试。弗吉尼亚理工大学图书馆则认为尽管已经开发出许多开源网页归档分析工具,但是很少有图书馆员和档案人员接受过培训以了解、使用、管理和维护这些工具,这也就导致了图书馆和档案馆难以提供满足客户需求的网络归档与分析服务。机构也同样认为工作人员的技能对网页归档项目的成功有着重要影响,2016年调查中更有69%的机构认为网页归档工具相关技能是工作人员最重要的技能之一。正因如此,弗吉尼亚理工大学图书馆联合了阿拉莫斯实验室、滑铁卢大学历史学系等机构于2018年5月启动了“继续教育推动网页归档”项目。该项目针对图书馆员和档案人员对网页归档培训,尤其是网页归档分析技能提升的需求,组织了一系列教育课程,帮助他们有效地使用创新的网页归档和网页分析工具来解决研究问题,更好地提供网页归档和网页分析服务。
  4结語
  总的来说,2016和2017年NDSA的网页归档调查反映了美国网页归档项目的发展与成熟,也体现了美国网页归档项目发展的一些新动向,这对我国网页归档实践有着重要的借鉴意义。
  (1)美国网页归档项目的建设主体呈现多样化的特点,不同类型的机构由于性质的差异,项目开展的具体情况也不尽相同。NDSA是一个为不同类型机构提供协商解决网页归档项目建设过程中各种问题的平台,为各机构更好地开展网页归档工作提供了便利。NDSA开展网页归档调查的初衷也是为了更好地识别和传达成员机构的需求。我们应当向NDSA学习,从整体上把握国内网页归档项目发展的现状,并持续追踪国内网页归档项目发展动向,从而实现更高效的资源配置,也能制定更有针对性的指导政策。
  (2)在美国,许多机构中档案、图书、资料管理职能都隶属于一个统一的管理机构即图书馆,图书、档案、资料一体化管理模式是美国档案管理体制的一大重要特色。近十年美国开展网页归档项目的机构迅速增加,高校图书档案机构的积极参与带来了美国网页归档实践的活跃期。网页归档合作计划的出现也推动了公共图书档案机构网页归档实践的发展。而我国档案工作与图书工作各自属于独立的工作系统,当前我国网页归档实践尚处于起步阶段,档案机构应当意识到网页归档对数字文化遗产保存的重要意义,主动承担网页归档实践主体的职责,并积极扩展与其他机构间的合作关系,推动机构间的资源共享,吸引更多机构参与网页归档实践,这也有利于推动我国网页归档项目建设的规范化和标准化。
  (3)网络资源归档服务和网络信息采集工具的开发和使用,为美国网页归档项目的发展提供了重要助力。我国网页归档实践尚不成熟,可适当引入国外开源网络信息采集工具,帮助网页归档项目实现在数据捕获这一关键环节的重要突破。网络资源归档服务的出现在很大程度上减轻了美国机构网页归档的负担,我国目前尚未出现相关服务的提供商,市场的空白也在一定程度上延缓了我国网页归档项目的发展进程。
  (4)网页归档分析工具的开发和网页归档培训的推出是机构推动归档网页资源开发利用的重要措施。网页归档项目的发展不仅依赖于技术,而且也与网页归档项目的团队建设息息相关。人员数量是保证网页归档项目顺利开展的基础,人员质量是保证网页归档项目建设质量的重要条件。我国网页归档项目的建设需要更多高质量人才的投入,优秀的团队建设也更容易获得其他资源的支持。因此网页归档高素质人才的培养和培训是我国网页归档项目发展不可忽视的重要方面。
其他文献
为了丰富档案馆馆藏档案资料,江苏省金湖县档案局决定面向全县离退休干部征集相关档案资料。其中,原县委报道组杨登平、姜瑞荣捐赠的“江苏改革开放五大成就——金湖户产万斤粮”相关资料,共计10页进馆收藏,成为见证金湖县改革开放历程的珍贵资料。  金湖县是一个只有30多万人口的小县,是1959年从宝应县、高邮县偏僻地区划出建立的新县。就是这样一个苏北小县、新县,在40年波澜壮阔的中国改革开放的大潮中,也曾经
期刊
“江苏档案”微信公众号荣获第三届全省新媒体应用创新奖  4月27日,由中央网信办网络新闻信息传播局指导,江苏省委网信办主办的“2018紫金网络传播创新峰会”在江苏常州开幕。省委常委、宣传部部长王燕文、中央网信办网络新闻信息传播局巡视员、副局长谢登科出席并致辞,颁发全省新媒体运用创新奖。“江苏档案”微信公众号荣获第三届全省新媒体运用创新奖。  会上,来自省内外400多位嘉宾共同探讨网络传播的创新成果
期刊
在网络信息时代,借助互联网平台,是档案工作主动深度融合信息社会的一种必然趋势,是一条行之有效的捷径。近年来,吴江区档案局高举档案文化旗帜,构建“吴江通”地域历史文化网站和“吴江通”微信公众平台,在国内同行中走活了网络“先手棋”,使档案工作从“深闺”迈向前台。“吴江通”网站日均点击量从五年前的不到100人次上升到8000人次。“吴江通”微信公众号在全国近400家档案微信影响力排行榜中,获得了2016
期刊
2018年7月15日爆出的一件事情令整个社会十分震惊,这便是吉林长春长生生物科技有限责任公司冻干人用狂犬病疫苗生产存在记录造假等严重违反《药品生产质量管理规范》行为,这是一起典型的档案造假违法行为。档案应该是社会实践活动真实的历史记录,所以,档案不容涂抹、不容更改、不容伪造。《中华人民共和国档案法》第二十四条第三款明确指出:涂改、伪造档案属违法行为,由县级以上人民政府档案行政管理部门、有关主管部门
期刊
[摘要]企业知识转移可分为内化转移和社会化转移。在企业知识转移过程中,档案作为企业各项业务活动的原始记录,是企业知识转移的重要载体和工具。通过档案对于知识的记录和固化,企业实现知识转移,在企业内部增强员工对企业的身份认同,助推科技发展;在外部市场中促进消费者对企业文化的了解,从而提升企业社会形象,增加市场份额。在企业实现知识转移过程中,应主动挖掘知识,增加知识存量,开放思维,扩展知识转移工具;树立
期刊
2017年12月,习近平总书记来到徐州,视察了多个地方。在马庄村,习近平总书记说,加强精神文明建设在这里看到了实实在在的落实和弘扬,实施乡村振兴战略,不能光看农民口袋里票子有多少,更要看农村的精神面貌、人的风貌怎么样。  对这个总户数637户、人口不足3000人的小村庄,总书记为何会给出如此评价呢?现在就让我们从几张发黄的照片档案,深入探访,寻找答案吧。  2018年6月30日晚,徐州市贾汪区潘安
期刊
3月7日,江苏省档案局(馆)召开主要领导调整宣布会议,省委常委、常务副省长、省委秘书长樊金龙出席并讲话,省政协副主席、省委组织部常务副部长胡金波出席并宣读了省委关于省档案局(馆)主要领导任免决定。陈向阳同志任江苏省档案局(馆)党组书记、局长、馆长。樊金龙代表省委、省政府对谢波同志担任省档案局(馆)长8年多来的工作予以充分肯定,并介绍了新任领导陈向阳同志的主要情况。  樊金龙指出,省委、省政府一直高
期刊
“危机”是指突然发生或可能发生的危及组织形象、利益、生存的突发性或灾难性事故、事件。“危机管理”以往通常应用于企业管理中,是指企业为应付各种危机情况所进行的规划决策、动态调整、化解处理及员工训练等活动过程。随着国内外环境的变化,风险社会的到来和政府管理任务趋于多元,风险政务已越来越成为各国制度创新和管理改进的方向,同样,国家档案馆也需要引入危机管理。  “档案利用”是档案馆的最前端,也是与社会直接
期刊
近年来,如皋市档案局围绕“档案强市”的建设目标,着力在全面提升基层档案管理水平上下功夫,创新工作模式,全力推进镇(区、街道)档案中心规范化建设。2014年,全市14个镇(区、街道)全部建成档案中心,实现镇级各部门、各门类档案集中统一规范管理,如皋市委市政府拨专款70万元给以奖补,省档案局局长谢波批示进行专项评估,2015年6月省档案局发专刊,在全省推广该局的做法和经验。近两年,该市又放大示范效应,
期刊
摘要:《论“零库存”档案馆》一文具有一定的启发性和创新性,但也存在着认识偏颇和理想化倾向。文章针对二位作者关于“零库存”档案馆可行性的分析和“零库存”档案馆模式的设计,结合档案管理的实际情况,从“零库存”档案馆的设想不科学、“零库存”档案馆的可行性依据不适用以及“零库存”档案馆设计的不合理三个方面进行商榷,认为“零库存”理念在档案管理中不可行。  关键词:零库存;档案馆;职责  分类号:G270 
期刊