BIBFRAME的理论及应用研究

来源 :现代情报 | 被引量 : 0次 | 上传用户:jenniechen007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  〔摘要〕为了适应网络环境,国会图书馆提出BIBFRAME书目格式。作为新的书目数据格式,BIBFRAME对内容不作限制,适用范围广,面向语义网。给出的用例看出,BIBFRAME的使用能够方便用户和图书馆员。目前,一些机构开始对BIBFRAME进行实证研究。本文从BIBFRAME的理论和应用两方面全面介绍BIBFRAME的进展。
  〔关键词〕BIBFRAME;书目数据;关联数据;MARC
  DOI:10.3969/j.issn.1008-0821.2016.01.016
  〔中图分类号〕G2572〔文献标识码〕A〔文章编号〕1008-0821(2016)01-0090-06
  〔Abstract〕Library of Congress puts forward BIBFRAME bibliographic format for adapting to web environment.As a new bibliographic data format,BIBFRAME facing semantic web has no restriction for context.From the use case,it is more convenient for users and librarians using BIBFRAME.Now,some institutions start empirical researches.This paper introduced the development of BIBFRAME from both theory and application.
  〔Key words〕BIBFRAME;bibliographic data;linked data;MARC
  1BIBFRAME的产生
  为了解决卡片目录存储、打印的问题,MARC格式应运而生。随着检索终端的开放,MARC成为标准的OPAC服务,为图书馆书目数据的编目、存储、管理等业务做出重要贡献,直到现在仍在图书馆界有一席之地。但是MARC记录只在Z3950标准开放API接口,与Web没有其它互操作[1],只能存在于图书馆管理系统和OPAC中,并不能将各图书馆的MARC数据快速、有效集成,也不能在Web中自由使用。在网络时代中,MARC的功能消退,并阻碍了图书馆融入到全球网络环境中。
  图书馆界在20世纪末已经意识到此问题,设计了一系列的内容标准(如RDA)和元数据标准(如DC),称为后MARC时代。后MARC时代的到来在一定程度上缓解了MARC不足,但是无法从根本上解决问题。2002年Tennant学者认为“MARC必须死”[2],2008年美国国会图书馆“书目控制未来工作组”在考察图书馆未来的书目发展技术时,认为MARC格式跟不上时代的发展,建议采用新的格式适应网络时代的发展[3]。在2008年浙江大学主办LIB20会议,Keven等学者进行了“MARC安乐死”的主题辩论。这些都说明了,MARC时代的消亡[4]。
  MARC记录的消亡代表新的记录格式的诞生。2011年5月,美国国会图书馆宣布“书目框架先导计划”,旨在开发一套适用于网络的书目框架格式。这种新的格式既可取代原有的MARC数据,同时兼容后MARC时代的各项标准[5]。2012年底,国会图书馆发布书目框架的关联数据模型草案,推出书目框架格式(即Bibliographic Framework,简称BIBFRAME)[6]。BIBFRAME基于语义网和关联数据,使得书目数据跳出图书馆的象牙塔,真正成为Web数据。BIBFRAME提出后,受到图书馆界的认可和追捧。随后,美国国会图书馆发布了BIBFRAME模型的框架、MARC记录转换为BIBFRAME的方法、元数据方案、用例等。
  2BIBFRAME模型架构
  1短期目标是定义BIBFRAME模型和准备进行转换,主要是理论知识研究。横向的短期目标包括远景评估和早期实验。纵向的短期目标包括远景评估、模型改进、转换改进。远景评估中对BIBFRAME的实现要求、目标、模型框架等进行了陈述及评估,确定了BIBFRAME实施的可行性及必要性。经过美国国会图书馆和高校图书馆的不懈努力,成功建立了BIBFRAME模型及转换机制[8],如图2所示BIBFRAME的中期目标是社区教育和过渡,主要进行实践研究。中期目标包括更多的机构参与测试、对BIBFRAME模型的再定义和应用文档规范化等。BIBFRAME的长期目标是被社会采纳,即使BIBFRAME全面用于Web网络,服务于用户。BIBFRAME的三大目标中,短期目标已经实现,中期目标部分实现。
  BIBFRAME模型中所有的对象都是资源(Resource)类,在最新的模型中下分16类:创作的作品(Creative Work)、實例(Instance)、规范(Authority)、注释(Annotation)、排列(Arrangement)、类别(Category)、分类(Classification)、描述管理性信息(Description Admin info)、事件(Event)、标识符(Identifier)、目标读者(Intended Audience)、语言(Language)、提供者(Provider)、相关的(Related)、标题(Title)、叙述(Relator,此类为最新模型增加内容)。其中,前4个类是BIBFRAME模型的核心类,每个核心类拥有不同子类。BIBFRAME模型中共有53个类。书目框架模型作为本体词表发布,命名空间为http:∥bibframe.org/vocab/,前缀为bf。作品(Work)是反映编目资源概念实质的资源,实例(Instance)是反映作品(Work)的个例的物理载体表现的资源。一个作品可对映多个实例,但一个实例只对应一个作品。规范(Authority)定义了作品和实例所反映的关系,是一个轻量级语义层。注释(Annotation)提供关于作品、实例或规范的信息。   3用例及实现
  为了说明BIBFRAME的功能,国会图书馆给出了15个用例,其中4个针对用户,11个针对图书馆工作[10]。
  31用户用例
  针对用户的用例使得用户能够查询书目信息、利用地理空间信息提供SoLoMo服务等。主要模式是查询——反馈。
  4实践应用研究
  2011年美国国会图书馆发起“书目框架先导计划”时,德国国家图书馆、大英图书馆等6个大型图书馆参与早期的试验,为BIBFRAME作出贡献。至BIBFARME框架形成后,有7个机构的8个馆藏对BIBFRAME测试[11]。7个机构包括大英图书馆、德国国家图书馆、乔治·华盛顿大学图书馆、美国国立医学图书馆、OCLC、普林斯顿大学图书馆、美国国会图书馆,其中美国国会图书馆有两个馆藏参与测试。在BIBFRAME推出后,VTLS公司积极投身到BIBFRAME的研发中,于2012年推出Open Skies图书馆服务平台,将BIBFRAME和关联数据作为卖点之一[12]。本文介绍图书馆界最新的BIBFRAME项目。
  41BIBFRAME与其他数据格式的映射
  411EDM项目
  欧洲数字图书馆(Europeana)计划设计一个通用的元数据方案将全欧洲的图书馆馆藏关联起来,涉及2亿条记录和1千万个数字对象[13]。为了存储海量的记录,欧洲数字图书馆以关联数据的形式提供数据集,使用欧洲数据模型(Europeana Data Model,简称EDM)组织数据。EDM数据集可以链接到多个外部词表,形成复杂的关联网络。EDM已经形成极有影响的书目数据模型[14]。为了整合图书馆界的文化资源,构建一个统一的信息基础设施平台,欧洲数字图书馆及相关人员进行了一系列努力,其中包括BIBFRAME到EDM的映射研究[15],映射模型如图3所示。
  412BNB项目
  大英图书馆发布的BNB数据格式,实现了全世界范围的检索、浏览。大英图书馆是参加早期BIBFRAME框架设计的图书馆,主要是进行MARC转BIBFRAME的探索[16],如图4所示。
  从图4可知,Pica主要有三大数据来源,包括MAB、MARC、BIBFRAME,三大数据源可相互转换。MAB可转换成MARC,MARC又可转换为BIBFRAME,使BNB形成BIBFRAME这种统一数据格式。在最初的大英图书馆书目数据中就包含了3 300 000条记录,并不断补充、扩展。
  42基于BIBFARME的发现和创造
  Linked Data for Libraries和Linked Data for Production是斯坦福大学参与的两个相互合作和相关的关联开放数据项目,这两个項目使用BIBFRAME开发和利用图书馆的关联数据[17]。
  421LD4L项目
  Linked Data for Libraries(简称LD4L)项目是斯坦福大学图书馆、康奈尔大学图书馆和哈佛大学图书馆创新实验室的合作项目,旨在建立一个学术资源语义信息存储(SRSIS)模型[18-19]。LD4L项目的数据来源如下:
  从图5可知,LD4L项目的数据源主要有书目数据(Bibliographic Data)、人员数据(Person Data)和可用数据(Usage Data)。书目数据的来源包括MARC、MODS、EAD,由于MARC数据的局限性(前文中详细叙述,此处不再复述),LD4L项目将MARC数据转换为BIBFARME[19]。LD4L的本体模型,如图6所示。
  图6左上角红色圆圈内部为学者Mark Twain链接到的BIBFRAME数据,包括Mark Twain创作的书《Adventure of Huckleberry Finn》,LD4L与BIBFRAME对接的属性为ld4l:creatorOf,BIBFRAME的属性为bf:creator。
  LD4L模型将人员、机构、作品等信息通过关联数据的方式连接起来,实现了信息的语义存储。图书馆员、领域专家在描述、标注、组织、选择、使用资源时,他们可以有效地获取有用信息。将MARC数据转换为BIBFARME格式使图书馆界的书目数据能够在Web中被检索,为广大用户使用。
  422LD4Prod项目
  Linked Data for Production(简称LD4Prod)项目是LD4L项目的扩展[16]。该项目由斯坦福大学图书馆、康奈尔大学图书馆、哈佛大学图书馆、哥伦比亚大学图书馆、普林斯顿大学图书馆和美国国会图书馆共同执行,基本目标是探讨在关联数据环境下,如何使用BIBFRAME创建元数据,探索编目规则如何适用BIBFRAME。LD4Prod项目主要针对图书馆界,旨在为图书馆界的元数据建立提供新的方式(使用BIBFRAME),同时对现有的编目方式提出改进。
  BIBFRAME的转换行动在2012年才发布初始模型报告,早期的研究集中于模型的总体框架、原则等理论部分,但是BIBFARME模型主要是面向实际应用,这两年来大型图书馆开始独立或合作进行实践探索。上述案例规模较大,影响较大,为BIBFRAME在图书馆界的实践应用提供参考。
  5总结
  51对图书馆界的机遇
  Web网络的发展改变了人们存储、搜索、发现信息的方式,对图书馆以集成管理系统和OPAC检索的服务方式造成了冲击。图书馆界庞大的书目数据只能局限于内部使用,无法被网络用户利用。蒂姆·伯纳斯·李(Time Berners Lee)提出“语义网”运动和“关联数据”概念后,图书馆界开始利用关联数据改进现有的数据,使其适应网络环境的发展。BIBFARME是其中的一项重要举措。
  从BIBFRAME的设计初衷及模型看,BIBFRAME给图书馆界带来以下机遇:(1)BIBFRAME的设计意图为不局限于任何内容规则,功能需求上着重支持语义网技术,使图书馆的数据能够在网络上被任意关联、使用[20]。(2)图书馆界致力于BIBFRAME的转换研究,可将MARC、EDM等格式的书目数据转换为BIBFRME,可建立统一的数据平台,为社会提供庞大的、高质量的数据。   52对图书馆界的挑战
  BIBFRAME是一项革命性的工作,对图书馆的用户服务、数据存储及利用带来了颠覆性的变革。这种变革是喜忧参半的,它在为图书馆提供机遇的同时也带来了挑战[21],包括:(1)BIBFRAME的主要数据是通过MARC转换而来,所以需要兼容MARC及后MARC时代的系统和技术,必需兼容以前的MARC数据和相关的技术,如SRU、Z3950等。(2)针对不同的国家需要进行不同的探索。我国图书馆界使用的书目数据格式为CNMARC,国内的图书馆有必要对CNMARC向BIBFRAME的转换展开实质性的研究。该研究具体涉及到CNMARC的字段、子字段、指示符及内容与BIBFRAME的类、属性等的对应关系,所需工作量巨大。(3)对现有图书馆工作的颠覆,包括采购、编目及检索。传统的采购数据是出版商提供的较简单的MARC数据,而采用BIBFRAME后,采购人员需要重新熟悉信息的显示方式。采购后,编目员需要到BIBFRAME新系统中使用SPARQL语言对作品进行检索,随后执行添加、修改、维护等操作,与原来的联合编目方法完全不同。BIBFRAME的使用对编目人员的业务流程改变最大,提出较大的挑战[22]。
  BIBFRAME能够适应网络环境的发展,使图书馆摆脱现有的尴尬处境。尽管BIBFRAME的全面实施面临一些困境,但在国会图书馆及几大高校图书馆的强力推进下,已经初见成效。
  参考文献
  [1]刘炜,夏翠娟.书目数据新格式BIBFRAME及其应用[J].大学图书馆学报,2014,(1):5-13.
  [2]Tennant R.MARC must die[J].Library Journal,2002,127(17):26-27.
  [3]On the Record:Report of the Library of Congress Working Group on the Future of Bibliographic Control[EB/OL].http:∥loc.gov/bibliographic-future/news/lcwg-ontherecord-jan08-final.pdf,2015-11-20.
  [4]娄秀明,危红.书目格式的过去与未来——从MARC到BIBFRAME研究[J].图书馆杂志,2015,(5):25-31.
  [5]Library of Congress.Transforming our Bibliographic Frame work[EB/OL].http:∥www.loc.gov/bibframe/nes/framework-051311.html,2015-11-20.
  [6]Library of Congress.Bibliographic Framework as a Web of Data,Linked Data Model and Supporting Services[EB/OL].http:∥loc.gov/bibframe/pdf/marcld-report-11-21-201.pdf,2015-11-20.
  [7]Library of Congress.BIBFRAME:Proposed Roadmap[EB/OL].http:∥www.loc.gov/bibframe/pdf/ALAmw2013-bibframe-draft-roadmapMcCallum.pdf,2015-11-20.
  [8]Library of Congress.Model View[EB/OL].http:∥bibframe.org/vocab-model/,2015-11-20.
  [9]Library of Congress.List View[EB/OL].http:∥bibframe.org/vocab-list/,2015-11-20.
  [10]Library of Congress.BIBFRAME Use Cases and Requirements[EB/OL].http:∥bibframe.org/documentation/bibframe-usecases/20130821.html,2015-11-20.
  [11]Library of Congress.Demonstration sample sets of BIBFRAME data[EB/OL].http:∥www.loc.gov/bibframe/implementation,2015-11-20.
  [12]Haslhofer B,Momeni E.Europeana Connect,Results and Resources[EB/OL].http:∥www.europeanaconnect.eu/documents/europeanatsreport.pdf,2015-11-20.
  [13]吳贝贝,夏翠娟.关联书目数据模型比较研究[J].图书馆杂志,2015,(5):71-79.
  [14]VTLS.VTLS Open Skies:A smarter frame work for library services[EB/OL].http:∥www.vtls.com/openskies,2015-11-20.
  [15]Zapounidou S,Sfakakis M,Papatheodorou C.Library Data Integration:Towards BIBFRAME Mapping to EDM[J].Springer International Publishing,2014,478:262-273.   [16]Library of Congress.Experience with the Bibframe model[EB/OL].http:∥www.loc.gov/bibframe/pdf/ALAmw2013-bibframe-update-Heuvelmann.pdf,2015-11-20.
  [17]National Information Standards Organization.NISO Webinar:Experimenting with BIBFRAME:Reports from Early Adopters[EB/OL].http:∥www.niso.org/news/events/2015/webinars/bibframeadopters/,2015-11-20.
  [18]Linked Data for Libraries[EB/OL].https:∥www.ld4l.org/,2015-11-20.
  [19]Coalition for Networked Information.The Linked Data for Libraries(LD4L)Project:A Progress Report[EB/OL].https:∥www.cni.org/pbs/the-linked-data-for-libraries-ld4l-project-a-progress-report,2015-11-20.
  [20]吳贝贝,宋文.从MARC走向Bibframe——后MARC时代的书目记录[J].图书情报工作,2014,58(9):85-90.
  [21]Tharani K.Linked Data in Libraries:A Case Study of Harvesting and Sharing Bibliographic Metadata with BIBFRAME[J].Information technology and libraries,2015,(3):1-19.
  [22]夏翠娟.面向语义网的书目框架(BIBFRAME):功能需求及实现[J].大学图书馆学报,2014,(6):61-69.
  (本文责任编辑:孙国雷)
其他文献
实施以德治国方略,以德治教,切实改革和加强高校思想道德教育,必须建立和健全求赵务实,科学有效的思想道德教育工作机制,加强对高校教职工的思想政治教育,不断探讨适应时代需要和大
明晰农业科技情报机构研发效率,有利于促进科技信息更好地服务现代农业发展。该文基于DEA测算我国农业科技情报机构研发效率,并比较分析部属和省属机构研发效率。结果为:(1)全国农
赣州市具有浓厚的红色文化底蕴、绿色生态文化优势,在创新和传承红色、绿色文化中,赣州市将区域文化创意园作为重要载体,加快发展区域文化创意园,对推动赣州市的发展有着重要
目的:分析对冠心病糖尿病患者进行血脂检验的临床价值.方法:在本院2016年-2018年间收治的冠心病糖尿病患者中随机抽取96例设为观察组,另取本院同期接受健康体检者96例为对照
水稻在抽穗期间,叶面喷洒乙烯利,可促进水稻提早成熟2—3天,并可减少空秕粒,增加粒重。喷施乙烯利的浓度一般以1000—1200ppm为宜。喷施时间可掌握在水稻齐穗后3—10天进行。不能
目的:浅析下肢大隐静脉曲张应用超声引导下注射聚桂醇泡沫硬化剂治疗的中期随访结果.方法:选取我院于2015年10月-2017年10月收治的52例下肢大隐静脉曲张患者作为对象,随机平
犯罪嫌疑人刘某某,男,某市人事局长。1993年初,全国刮起了一股干部下“海”经商风。当时还在副局长位置上的刘某某,不失时机地向组织提出了下“海”经商,为局机关谋福利的请求。经
目的:探讨彩色多普勒超声对女童特发性性早熟的诊断及治疗后超声动态监测的临床价值.方法:随机选取2017年10月—2018年12月我院收治的59例特发性性早熟女童设为观察组.同时随
大棚栽培早春莴苣宜选用耐寒性强的尖叶早熟品种,如合肥尖叶鸭蛋莴苣和北京鲫鱼莴苣等。
确保自交系的纯度,应做到以下几点:一、防杂重于去杂,严格设立隔离区1.最好是在山区半山区自然形成的地块,或人参地,要求周边没有玉米生产田。2.在水稻生产田中的旱地,周边10
期刊