学位论文元数据Open API开发与应用

来源 :图书与情报 | 被引量 : 0次 | 上传用户:ggb1977
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:文章在归纳总结学位论文Open API开发的相关需求基础上,介绍了基于学位论文Open API开发与应用的具体方法。结合华东师范大学图书馆实践,阐述了学位论文在社会服务、促进产学研合作以及决策支持方面的作用。
  关键词:学位论文 Open API开发 应用
  中图分类号: G306 文献标识码: A 文章编号: 1003-6938(2013)04-0069-05
  目前,国内大学图书馆学位论文数据库建设都已初具规模,以华东师范大学图书馆(以下简称:华东师大馆)学位论文数据库为例,目前已经收录了所在院校恢复高考以来的全部博硕士学位论文。其明显的持续性特点,已经成为大学图书馆特色资源的重要组成部分。然而,目前国内大学图书馆的学位论文数据库仅仅作为学术资源提供本校读者检索和全文下载服务,其主要原因在于学位论文管理系统平台服务模式简单、系统封闭且只注重检索功能所致。探索学位论文拓展服务的新途径,对推进图书馆利用学术资源开展深层次服务、提升大学学术资源全方位服务能力,使其在服务社会、支持教学科研过程以及促进产学研合作中发挥积极作用,具有非常重要的现实意义。
  针对当前大学图书馆特色资源服务模式简单、系统封闭、单一学术型功能等特点,华东师大馆以学位论文数据库为例,在探索其深层次拓展服务模式方面做了一些尝试。通过开发基于数据库平台的元数据Open API,实现了学位论文的拓展应用。并结合当前较为主流的通用门户网站开发环境,开发了标准的应用端Open API调用程序框架,为学位论文元数据嵌入社会网络环境及用户门户网站的数据融合提供参考和借鉴方法。
  1 学位论文元数据Open API开发应用需求分析
  1.1 国内外应用现状
  当前,国内的学位论文主要由数据库商、国家法定学位论文收藏机构、公益性学位论文共建单位以及各高等学校和科研院所等提供相对集中的检索和分级分布联合保障相结合的信息共享服务。但在利用学位论文元数据拓展其服务范围、开展增值服务等方面还有进一步拓展的空间。华东师大馆在学位论文数据库回溯建库工作中,对如何利用学位论文元数据开展深层服务进行了有针对性的国内外应用调研。美国普渡(Purdue)大学在开展学位论文为社会服务方面,推出了一个Web服务[1],其涵盖全州所有大学研究者目录以及一个可以在搜索结果页面显示每一位研究者指导的学位论文信息,为研究者和商业人士提供了一个获取学者以及其指导学位论文元数据的检索平台,在推进研究成果商业化方面进行了有益的尝试。平台后端的元数据信息,即通过全州各大学学位论文数据库系统元数据Open API自动获取,这种数据获取方式较好地解决了自动获取多来源异构或同构数据以及数据同步更新一致性问题。在国内,中国科学院国家科学图书馆建立了基于馆藏特色资源元数据Open API的集成服务支撑平台[2-3],用以支持面向用户环境的嵌入式服务。上述国内外利用学术资源开展的拓展服务为探索学位论文元数据Open API开发与应用提供了可借鉴的实例。
  1.2 需求分析
  随着越来越多学术资源/内容的出现,基于学术资源支持教学科研的属性,图书馆一直以来都在致力于基于学术资源元数据进行分类整合和发现工具的研究,以提高在浩瀚的学术资源中为读者快速提供所需资源的能力,而学术资源元数据的其它属性往往被忽略。以学位论文为例,它作为大学的特有学术资源,除了拥有支持学术研究之外,因其特有的原创、研究生培养以及与教学关系紧密等属性,在社会服务、教学水平评估以及辅助决策支持等方面可以发挥其独特的作用。
  在开发学位论文元数据Open API的应用调研过程中,重点调研了与学位论文有关的研究生院、学校信息化办公室、有硕博士授权的部分院系以及相关管理部门。主要的需求表现在以下几方面:
  (1)研究生院的需求。在为社会考生提供招生信息方面,研究生院的老师们在多年的招生实践中体会到,社会考生在报考研究生时,首选各大学研究生院门户网站作为信息源,考生希望从中获得大学招生人数和招生专业信息的同时,更希望找到符合自己研究兴趣的指导教师详细信息,每年的招生季都会有很多类似的咨询。因此,研究生院希望通过将学位论文元数据嵌入到招生信息的相关查询中,社会考生可以在查询博硕士招生信息的同时,获得教师历年培养研究生学位论文信息。
  (2)信息化办公室的需求。华东师范大学门户网站由学校信息化办公室负责建设。大学门户网站及院系所门户网站作为宣传大学教学科研成果的社会网络窗口,一般都设有类似“教师名录”或“教师简介”等栏目,栏目主要用于展示教师的教学、科研以及社会兼职等个人信息,通常这些信息需要教师个人维护。往往由于各种原因,类似栏目的动态信息更新不及时,甚至空白,没有起到栏目设计之初的作用。因此,信息化办公室及院系的老师都希望动态将教师指导研究生的学位论文信息嵌入到“教师名录”或“教师简介”页面中涉及教学成果信息栏目。
  (3)学校职能部门的需求。职能部门的需求表现在利用学位论文元数据信息辅助教学水平评估及反映学科发展变化方面。希望利用学位论文特有的原创、研究生培养以及与教学关系紧密等属性,为学科发展、评估教师教学能力和学位论文质量等方面提供科学的统计数据。
  1.3 技术思路
  Web Service、SOA等技术架构为解决异构环境中的数据传递、应用互操作提供了充分的支持。针对学位论文数据库系统本身的特点,采用WCF平台进行面向应用的Open API的开发,提供学位论文信息服务Web Service,让不同系统的第三方应用根据需要调用学位论文元数据Open API,实现同构或异构平台之间的数据共享和互操作。同时采用轻量级的Web Widget技术,将小巧的客户端学位论文信息服务调用代码嵌入到用户浏览的网页中,实现学位论文信息的直接推送。通过面向服务端与面向客户端这两种互补的技术方式,来满足学位论文信息服务多样化的需求。   利用Open API拓展学位论文的服务范围和应用领域,其核心技术之一是数据通过网络进行传输。因此,提高数据在传输和应用过程的安全、稳定性非常重要。同时,Open API的应用推广有其特殊性,它与一般的Web应用不同。因此,在学术资源Open API开发过程中,还需要关注以下问题:
  (1)明确应用基础上的针对性开发原则。Open API与Web服务不同,它本身并不能实现任何一个完整的服务,需要Open API提供者和应用平台两方面协作完成。因此,有明确的需求是快速实现Open API应用的必要前提。
  (2)遵从调用方式简单的开发原则。Open API开发的最终目的是为应用服务,要完成一个Open API的应用部署,应用平台需要辅之以必要的编码才能实现Open API的嵌入。因此,Open API的调用方式方便与否决定应用部署的成败。
  (3)注重数据传输过程的安全控制原则。与互联网资源Open API不同,学术资源Open API是针对学术资源而开发的,其后台数据的安全性要求较高。因此,防止非法应用恶意调用的控制机制是保证数据源安全的重要环节。WCF安全控制框架下的X509证书以及在系统部署中兼顾防火墙和入侵防御系统等技术在Open API开发和调用过程中非常重要。
  2 技术实现
  在基于上述学位论文元数据Open API开发应用的需求分析基础上,在程序开发过程中采用通用框架,以屏蔽学位论文数据库与应用端平台的异构性、开发语言的多样性等问题。同时,最大化降低所开发Open API的调用复杂度,以利于Open API的推广使用。基于这样的开发理念,开发了两种不同方式的API——Web Service API和Widget API,并提供相应API调用说明和调用应用案例。应用端可根据调用说明,套用案例快速实现学位论文Open API的调用,达到应用的快速推广。
  2.1 Web Service API开发
  Web Service、WCF平台等技术为解决异构环境中的应用相互操作提供了充分的支持。Web Service技术实现了不同的系统之间用“软件-软件对话”的方式相互调用,软件应用之间可以基于Web无缝集成。WCF作为基于面向服务体系结构标准的分布式应用程序开发模型,具有很好的互操作、安全可信赖性以及通用性,并可以以一系列协议的定义、实现、发布为流程和框架,通过服务实现与服务内容的分离,轻松为学位论文数据库构建松耦合的分布式Web Service API。针对学位论文数据库系统平台特点,在.NET环境下,以WCF为技术支撑,采用WSDL描述语言及SOAP协议,以面向服务的方式来创建学位论文Web Service API:
  (1)以将为应用端开放的服务为依据进行服务协定定义,如以“专业代码”为参数,返回元数据集:
  DataSet GetDataByMajor(string majorCode);
  (2)实现服务协定
  public DataSet GetDataByMajor(string majorCode)
  {…// 详细实现,将结果保存在数组中返回}
  (3)搭建宿主,发布服务
  公开WCF服务,以IIS+.NET Frameword 4.0环境为例,以IIS作为宿主承载服务。
  WCF的学位论文 Web Service API的通信机制是基于SOAP的Web服务,因此所开发的API可以与运行在不同环境中的应用进行通信。开发的Web Service API将学位论文获取服务封装成一个URL后发布,用所开发的Web Service取代用户对学位论文数据库的直接读取服务。应用端从服务器端获取数据时处于一个相对透明的状态,只需要根据API调用说明文档了解API对外提供的函数及参数说明,在其Web服务中引用所发布的URL后,系统会生成访问数据库的类和对象,并将其实例化,即可像使用本地的函数一样来实现调用Web Services API提供的数据资源,无需关心数据库系统内部结构,从而实现异构平台之间的数据传递和互操作 (见图1) 。
  由于学位论文的特殊性,在接口开发时需要考虑推送数据的安全性,以确保所开发的Web Service API被授权的第三方调用。在安全控制机制上,采用X509证书机制,经过X509证书加密后的输入及获取到的输出内容,均为被加密的密文,即使是在公网中,也无法看到明文,确保了数据的传输安全;应用端和服务器端证书对匹配,又确保了接口的调用安全。
  2.2 Widget API开发
  借鉴Web Widget的开发模式,通过开发学位论文Widget API,将学位论文平台和第三方应用平台通过所开发的API联系起来,打破了网站间的屏蔽,使网站不再只是通过超链接的简单连接,便可以实现在第三方网站中混搭学位论文信息。在软件部署上兼顾Web应用防火墙和入侵防御系统等方式来增强数据的安全控制,确保数据传输的可靠性、安全性。学位论文Widget API主要分服务端、视图层、应用端三个框架。其中,服务端基于ASP.NET实现从学位论文数据库中获取信息;视图层定义学位论文展示形式,即相应的.js和.css文件;应用端传递相关参数并发起学位论文Widget API的调用命令。采用jQuery开发技术,将应用端的用户查询内容以Get的方法发送到学位论文数据库服务器端,学位论文数据库服务器以JSON格式返回查询结果到应用端,应用端通过嵌入视图层的相关代码,实现返回的学位论文信息在本地网页中的重现和融合(见图2)。
  应用端调用Widget API时,只需要在其门户网站相应检索位置嵌入一段JavaScript脚本语言代码,并参考API调用文档中提供的查询参数说明,便可以实现从服务层获取数据并按照视图层预先设计好的结构在本地网站展示,完成调用此类型的Open API功能。   //通过jQuery技术将应用端查询返回到服务器端,调用服务器端Widget.aps程序查询相关学位论文信息,Widget.aps会将查询结果以数组返回。
  $.getJSON("http://IP地址/Widget.asp?callback=?&type="+type+ " &keyword="+keyword+"&page="+page,function(data){disp(page, data);});}
  disp(page, data){…//对获取到的学位论文信息进行重组及重现};
  视图层的数据重现方式可以是应用端自主开发,华东师大馆为了学位论文API的应用推广,还为应用端提供了视图层的数据重现方式参考案例,应用端可以直接将相关代码嵌入到自己网站中,若应用端需要特定的展示方式,则需要应用端做简单的本地化修改便可以使用。
  3 华东师范大学图书馆的实践
  3.1 研究生院门户网站应用
  在华东师范大学研究生院的研究生门户网站,将学位论文元数据嵌入到博硕士招生信息查询栏目,社会考生可以通过 “专业名称”等途径查询历年研究生学位论文元数据(以“专业名称”为“逻辑学”的查询结果见图3)。
  长期以来,学位论文只是作为学术资源提供本校读者的检索和下载服务,其学术资源以外的属性没有得到充分发挥。通过学位论文元数据Open API嵌入研究生院门户网站的应用,社会考生可以通过多途径了解学校研究生培养方向以及教师指导学位论文的数量、选题、研究方向、摘要等信息,对社会考生报考学校和选择符合自己研究兴趣的指导教师提供参考。同时发挥了学位论文作为学术资源的社会服务功能,使学术资源在社会层面得到共享。这一应用得到了研究生院的充分肯定,每年有专项经费作为应用的支持。
  3.2 学校门户网站应用
  学位论文元数据Open API在学校教师主页的嵌入式应用,拓展了学位论文数据库服务范围,实现教师指导学位论文信息的动态发布。以软件学院某教师为例,其个人简介界面嵌入“指导学位论文信息”链接,点击即可获取其历年指导研究生学位论文信息(见图4)。
  这一实践较好地实现了利用第三方平台——学校门户网站展示本校教师教学学术成果,实现学位论文元数据的针对性开放。并通过多途径、多渠道扩大教师学术影响力和社会知名度,同时,院系门户网站可以通过教师工号及姓名调用学校“教师名录”栏目信息,在院系门户网站展示本院系教师指导学位论文的相关信息,从学科或专业角度展示学校教学研究成果,增强行业竞争力。这一应用对扩大教师学术影响力、促进教学研究成果转化生产力以及产学研结合起到积极的促进作用。
  3.3 学校职能部门应用
  (1)通过Open API获取各学科或子学科的批量数据,加之年限分面限制,从历年学位论文数量变化角度反映各学科领域研究趋势。通过结合Google图形接口,从Open API返回查询结果的XML格式数据直接提交到Google API,即可产生图形化分析结果。反映了“电子科学与技术”和“数学”专业学位论文数量的变化关系图(见图5)。
  (2)通过Open API获取各院系的批量数据,辅以学院、专业以及年代参数限制获取相关学位论文元数据,并通过中国优秀硕士学位论文全文数据库(CMFD),运用屏幕抓取技术,可以直接获取学位论文被引数据,从中产生学位论文被引分析报告。通过教师指导学位论文被引数量这一侧面,为学校从学位论文被引角度评价教师指导学位论文质量提供了准确的参考数据(以教育科学学院2010年毕业生高被引学位论文为例的被引分析见表1。其中,学生、教师名字以编码表示;统计时间:2013-4-29)。
  (3)通过Open API获取学位论文元数据,结合指导教师和学生的关联关系,从教师出发,可以得到学生以及学生的学生等关联关系,形成上有教师下有学生,学生下面还有学生的学者关系网,从中可以分析从一个教师出发所形成的教学科研人员关系网(见图6)。
  学位论文作为学校教学科研成果的重要内容之一,从某一方面可以反映学校的教学科研水平。根据职能部门的需求,通过学位论文元数据Open API获取特定需求数据,为学校职能部门提供第一手教师以及研究生的人员管理和统计分析数据,充分发挥了学位论文在支持管理决策方面的积极作用,应用得到了学校人事处、师资办、学科办以及研究生院的充分肯定。
  4 结语
  学位论文是我国拥有自主知识产权的重要信息资源和知识宝藏。其有效的开发和合理利用,不仅是大学和科研机构高层次人才培养的需要,还关系到学位论文原创性成果的社会化利用和论文创新成果的转移,是知识经济时代国家创新发展的需要[4-5]。华东师大馆在利用学位论文元数据Open API开展拓展服务方面做了一些有益的尝试和探索,希望借鉴国内外成熟的混搭应用实例,把具有稳定、合法、可靠的学位论文数据库作为数据源,在原有学位论文仅仅作为学术资源提供检索服务基础上,推进学位论文深层次服务的开展,以改变学位论文数据库仅仅作为学术资源的单一属性。充分挖掘学术资源的多重属性,有效提高了学术资源的服务能力。
  学位论文Open API的开发与应用不仅为大学图书馆探索利用学术资源开展深层次服务提供了参考模式。同时,图书馆作为数据库建设方,随着应用的不断拓展,带来更多校内外用户的持续关注,也促进了学位论文数据库的不断优化,提高了数据库的完整性和数据的准确性。
  参考文献:
  [1]Nicole C.Engard. Librayr Mashups:Exploring New Ways to Deliver Library Data[M].Information Today,Inc.,2009:285-287.
  [2]李峰等.跨界数据融汇模型研究[J].现代图书情报技术,2010,(11):24-28.
  [3]李春旺.图书馆集成融汇服务研究[J].现代图书情报技术,2009,(12):1-6.
  [4]贺德方等.中国学位论文收集与服务系统的构建[J].情报学报,2009,(8):634-640.
  [5]赵杨等.国内外学位论文共享服务发展趋势与对策分析[J].情报资料工作2008,(4):68-72.
  作者简介:作者简介:于亚秀(1965-),女,华东师范大学图书馆馆员;李欣(1961-),女,华东师范大学图书馆研究馆员;刘丹(1979-),男,华东师范大学图书馆馆员;张毅(1986-),男,华东师范大学图书馆馆员;陈枝清(1979-),女,华东师范大学图书馆馆员。
其他文献
父亲14岁参加工作,18岁学会抽烟,已经有整整48年的烟龄了,堪称“老烟鬼”。父亲的身体一向很好,从来没有生过什么大病,平时要是有个头痛脑热、感冒发烧的,父亲照样抽烟,只是
国际经济与贸易专业实验教学具有模拟性、开放性、探索性和综合性等特点,根据这些特点,该专业教师应具备的实验教学能力包括设计创新能力、实验操作能力、信息技术应用能力和
限产保价或难持久。时至6月底,国内尿素行情表观局势尚稳,特别是报价层面,山东、河北等主产区仍能维持在1950~2000元/吨的水平,部分业内人士将支撑尿素高价的利好归功于近两周以来
齐总正坐在会议室开会,秘书慌慌张张地闯进来说:“齐总。小豫刚刚打来电话,说在国道上出车祸了。您的手机一直关机,他急坏了。”齐总的脸色变了:“人怎么样?受伤了吗?”“人没事。他
记得那是1973年我读小学三年级.从沈阳来的“五七战士”张岩老师做了我们的班主任。她下放前在沈阳市和平区的一所小学教学.接手后.她惊异于我们快读完了三年级.竟然都没学过拼音
罗吉尔.培根.哲学家.世界上最早相信地球是圆形的人。距今800年前,他在写给朋友的信中说:“总有那么一天.我们会赋予运输车难以置信的速度.而无需求助于动物。”
本研究根据研究者编制的三个空间观点采择任务,对40名3~6岁儿童进行了空间方位判断的测验,结果发现:(1)被观察对象的特征、另外两个观察者与被试儿童的位置关系对学前儿童的空
根据人的发展和解放的程度,可以把人类历史划分为“人的依赖关系”一“物的依赖性基础上的人的独立性”一“自由个性”三个发展阶段。以此为主要依据,可以将教育的历史发展,分为
《孩子的故事》是“爱心救助”的故事。孩子们自发行动,组成了惊天动地的交流融汇,如果我们大家都自觉领悟并行动,人间就永远是美好的春天。
图书馆与用户之间的传统价值关系因信息环境的变化而受到挑战,学科服务所强调的主动化和专门化特质改变了传统图书馆的服务局面,充分体现了"用户主导性"思想,图书馆通过主动掌