基于语义网技术的高校图书馆个性化知识服务研究

来源 :新世纪图书馆 | 被引量 : 0次 | 上传用户:winnerlb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要 论文提出了一种基于语义网技术的高校图书馆个性化知识服务。该方法首先通过语义网技术和数据挖掘技术对高校多部门的数据资源进行整合;然后根据用户的相关信息构建出用户的个人兴趣模型;最后使得用户可以快捷、高效、准确地获取资源。
  关键词 大数据 高校图书馆 语义网技术
  分类号 G250.76
  DOI 10.16810/j.cnki.1672-514X.2017.11.012
  Research on the Individualized Knowledge Service of University Libraries Based on Semantic Web Technology
  Zhao Xiaorong, He sheng, Qian jin, Liu yijun, Qian xiufang
  Abstract This paper proposes an individualized knowledge service of university libraries based on Semantic Web. Firstly, the digital resources of multiple departments of university will be integrated by the semantic network and data mining technology. Secondly, the user’s personal interest model will be build based on the user information. Finally, the users can get access to services quickly, efficiently and accurately.
  Keywords Big data.University library. Semantic Web technology.
  随着大数据时代到来,图书馆服务系统基础设施结构和用户服务模式在发生变化的同时,大数据也在重构了图书馆对用户阅读需求发现、服务资源整合、服务提供和服务质量 (Quality of Service, QoS)保证的过程和方法[1]。当前高校图书馆中应充分地利用大数据技术对丰富的馆藏资源进行分析挖掘,从而更好的为用户开展个性化服务。高校图书馆个性化推荐应该是以用户的个人背景、专业领域、兴趣和习惯等个性化信息为依据,通过对用户的个性化信息分析与挖掘,最终为每个用户快速定制个性化的推荐服务[2-5]。在图书馆的知识服务中,个性化推荐是图书馆知识服务的重要组成部分,也是关键的应用领域。个性化服务最直接的体现就是“以用户为中心”的学科服务,图书馆根据用户的查询和登录来定位用户的研究领域、科研项目以及用户的个性与习惯进而来对现有馆藏等知识资源的组织、分析与推送而实现向用户提供个性化服务。
  1 高校图书馆个性化知识服务研究进展及挑战
  1.1 图书馆个性化知识服务的研究进展
  图书馆个性化推荐服务的核心任务是如何通过深度挖掘用户兴趣和偏好信息,并把挖掘所获得的信息与馆藏资源信息关联起来,最终能够准确,高效地把用户所感兴趣的资源信息推送给用户。图书馆个性化推荐最终需要实现两个方面的目的:一方面,图书馆个性化推荐可以很好地帮助用户发现对自己有价值的馆藏资源,让用户更加容易的获取有用资源;另一方面,图书馆个性化推荐应该让馆藏资源最大程度地展现在有需求或有潜在需求的用户面前,从而让馆藏资源得到合理、高效的利用[6]。
  国内目前的研究主题主要集中在服务模式、信息资源建设、用户兴趣建模、服务方式、服务技术等方面,并始终以高校图书馆为主要载体[7]。
  本文通过对我国知名高校图书馆网站的调查来了解目前高校图书馆个性化推荐的应用现状,调查结果如表1所示[8]:
  从表1中可以看出,目前我国高校关于图书馆内图书推荐方面的应用还比较欠缺,除了南京大学以外的5所大学的推荐系统都属于“非个性化推荐系统”,且该系统是一种初级的个性化推荐。虽然部分高校也推出了相关的个性化服务,但推送内容仅限于把该领域的所有书籍或文献全部提交给用户,没有对所推荐信息进行“二次加工”。
  2000—2002年主要注重个性化服务理念推广、国外研究成果的吸收以及图书馆的数字化;2003—2006年出现了大量的新研究方向,逐步形成核心研究主题;2007—2012年逐步关注用户兴趣建模、技术实现,不断丰富服务方式,提高服务精准性、语义性和交互性[7]。
  1.2 图书馆个性化知识服务面临的挑战
  数字图书馆是对传统图书馆资源进行了数字化,相对于传统图书馆的资源获取更加容易。目前,图书馆已经进入大数据时代,图书馆大数据产生了海量的半结构化、非结构化数据,这些在组成结构、类型格式、存在形态上各具特点。图书馆大数据环境呈现出“4V+1C”的特点[9-10]。具体表现为:(1)Variety,数据各类繁多,包括结构化、半结构化和非结构化等多类型数据;(2)Volume,具有庞大数据量,且每年以60%的速度递增的特点;(3)Velocity,数据的快速处理,数据的处理与分析具有较强的实时性要求;(4)Value,数据的高价值;(5)Complexity,大数据处理难度、用户兴趣捕捉难度和领域专家定位难度较大。
  面对上述所述的结构、类型格式、形态各异的海量数据,高校图书馆个性化服务所面临的挑战主要表现在以下几个方面:(1)对于关联度較低的各类数据,如何使其差异性和异构性在发现平台进行无缝连接、统一检索。(2)为了更好的服务用户,图书馆在进行个性化推荐时必须建立用户兴趣模型。高校图书馆在整合现有资源的同时,还需要有效整合学校相关部门的数据资源。如果仅仅是把这些数据简单地堆砌在一起,用户很难进行有效的知识发现并得到有价值的信息。(3) 这些海量的数据如何有效存储以及如何为用户提供高速访问也在挑战着传统的存储方式。   2 高校图书馆个性化知识服务应用模式
  高校图书馆虽然有着丰富的图书、现刊、中外文文献和硕博论文等资源,但广大的师生却没有能从中获得更好的服务。因此,图书馆个性化服务首先需要准确地实现对用户的定位,然后才是对用户信息需求进行分析与研究,最后才能有针对性地对用户进行个性化服务。
  2.1 高校图书馆数字资源及其整合
  高校图书馆数字资源涵盖了中外科技期刊全文期刊、硕博论文、会议论文和书刊等门类齐全的数据库,其结构见图1。对于这些数据库,若从提高资源利用角度来说,其数据的活力与价值就在于数据交换中的各类数据的联动[11]。
  为了更好的服务于师生,高校图书馆还必须整合高校各级部门数据,如科研部门、教务部门和学工部门,然后对数据库进行关联数据挖掘和聚合。聚合主要包括三个层次:结构层次、信息层次和语义层次。(1) 结构层次上的聚合,主要目的是为了降低资源之间的结构上的异构性[12]。(2) 信息层次上的聚合,主要目的是将具有相互关系的信息形成一个有机统一体[12]。(3) 语义层次上的聚合,主要目的是实现数据的融合并产生新的数据信息供用户使用。
  由于高校各部门的数据资源具有较强的异构性,因此,构建基于高校图书馆的大数据挖掘与分析决策体系,需要对各部门中各类数据进行采集、抽取、清洗、关联、分析,发掘出数据的潜在价值,为高校图书馆的发展提供夯实的分析决策驱动模型,并为高校及图书馆的管理者提供决策与分析基础[11]。
  语义网技术能很好地解决数字资源的语义描述问题,从而实现数字资源之间的整合、集成和语义关联[13]。语义网技术在图书馆个性化服务系統中的应用主要体现在三个方面:语义描述标准、本体的构建和关联数据的产生。对数据信息的准确分类、语义关系和领域本体构建是语义网质量的关键。图书馆还可以通过引入知识评价,将用户需要的、高质量的资源进行过滤和排序并推送给用户,使得用户能够获取更好的服务。
  2.2 高校图书馆个性化知识服务模块整体框架
  本文所提出的个性化模块主要是由四部分组成:(1) 数据资源层。数据资源层分为系统数据库和网格节点集合两部分。系统数据库是由高校数字图书馆通过提取和聚合而形成的,高校数字图书馆是由包括图书馆内图书信息库、期刊信息库、学生成绩库、教师信息库等构成。系统数据库是为后面的两个层(语义网格平台层和个性化推荐层)提供信息服务。网络节点集合层对底层信息资源进行建设,同时将提供的服务注册到语义网平台。(2) 语义网格平台。该层包括网格平台的安全管理、网格监控与维护、网格智能管理等。语义网格平台是使用RDF(Resource Description Framework)来进行标准化信息描述(参照元数据标准),并实现数据的采集和语义注释组件等,为个性化推荐层提供支持,并根据用户反馈进行系统数据库的更新。(3) 个性化推荐层。该层实现了推荐任务分解和推荐策略的制定,同时利用对用户信息积累以及数据挖掘和聚合来及时更新系统数据库;(4) 用户交互层。该层主要实现用户信息的收集、推荐请求与推荐信息显示、用户反馈信息的接收等。基于语义网技术的高校数字图书馆个性化服务应用模式整体模型如图2所示。
  2.3 高校图书馆个性化推荐模型
  个性化服务就要针对不同用户个性需求来提供服务,高校图书馆主要服务对象是教师和学生。通过用户登录信息来进行用户定位,通过对用户搜索信息以及用户所在院系来确定用户的兴趣模型,通过关联信息来获取相关领域或学科的优秀学生或教师,并通过对优秀学生或科研成果突出教师的数据库进行定位,同时对用户进行个性化推荐,而要实现上述图书馆个性化服务必须为用户建立个人兴趣模型。基于语义网技术的高校图书馆个性化推荐模型如图3所示。
  个人兴趣模型依据用户的搜索信息数据、所在学院信息、专业信息、科研和学科方向、专业、团队方向和发表论文情况等信息来建立,因此高校图书馆必须强制推动图书馆与校内多部门的数据共享,如科研部门、学工、教务部门等。
  在个性化推荐模型中,领域本体要根据兴趣信息数据对高校图书馆系统数据库中的学科进行语义重组,并通过数据挖掘来建立关联规则库[14],这样用户通过登录进行信息确认后,就自动实现和用户兴趣库匹配。本文以学生和教师两种用户来详细介绍图书推荐方法。
  (1) 学生用户。学生用户使用个性化服务平台的目的主要是学习知识并最终掌握知识,因此学生用户主要想从图书馆资源中获取对知识点的归纳与总结文本、教学视频、习题讲解与练习和相关感兴趣的领域信息等。由于图书馆个性化推荐平台利用高校多部门的协作和数据共享,并对数据信息进行深度聚合,使得对学生用户的兴趣模型建立更加准确,从而能让学生用户更加准确、便捷的获取图书馆中的有用资源。
  学生用户个性化推荐平台具体流程:学生用户在使用图书馆个性化平台时,首先要进行用户登录,通过登录信息,系统进行用户信息定位,如学生所在学院、所学专业和成绩等个人信息。系统通过对用户最近6个月数据信息进行分析研究,重构用户兴趣模型,最终对学生用户形成个性化推荐。
  (2) 教师用户。教师用户使用服务平台的目的主要是获取相关研究领域的最新研究进展、研究动态、期刊文献、教学视频和论文集等。因此,本推荐平台可以根据用户所从事的学科特点和专业特色,以及本人的成果来获取准确的用户兴趣模型,并实现对教师用户进行本专业最前沿的信息资源的推荐。
  教师用户个性化推荐平台工作流程:教师用户在使用图书馆个性化平台时,首先要进行系统登录,登录后系统对教师用户信息进行定位,如教师用户所在学院、所学专业、研究成果等相关个人信息,同时重构用户的个人兴趣模型;根据检索关键词把相关学科领域的科研热点、研究进展以及该学科近三年学校立项的省部级以上项目题目和优秀教师(通过教师个人成果库按一定标准筛选所得)推荐等形成报告推送过来;最后系统会把结果形成个性化推荐给用户。   3 结语
  基于语义网技术的高校图书馆个性化服务是通过语义网技术和数据挖掘技术对高校各部门的数据以及用户查询数据进行采集、抽取、清洗、关联、分析,从而为用户建立个性化兴趣模型,最终用户可以快速、高效、准确的获取个性化推荐服务。该应用能够有效化解高校图书馆学术资源过载与用户资源获取困难之间的矛盾,并能高效、合理的利用图书馆资源,同时对高校图书馆个性化服务研究者具有很好的参考意义。
  参考文献:
  1马晓亭.基于可信大数据的图书馆个性化服务平台构建[J].图书馆理论与实践,2015(1):85-88.
  2曾子明,金鹏.智慧图书馆个性化推荐服务体系及模式研究[J].圖书馆杂志,2015(12):16-22.
  3聂珍,王华秋,周建.个性化推荐技术在图书馆服务中的应用[J].现代情报,2013,33(9):95-102.
  4金勇进.图书馆个性化推荐方法研究[J].软件,2014,35(4):125-129.
  5杨华.数据挖掘在高校图书馆个性化推荐中的应用研究[D].四川:电子科技大学,2009.
  6王连喜.一种面向高校图书馆的个性化图书推荐系统[J].现代情报,2015(12):41-46.
  7孙雨生,仇蓉蓉,黄传慧,等.国内数字图书馆个性化服务研究主题演化分析[J].情报理论与实践,2014,(08):41-47.
  邱均平,张聪.高校图书馆馆藏资源协同推荐系统研究[J].图书情报工作,2013(22):132-137.
  陈臣.大数据时代一种基于用户行为分析的图书馆个性化智慧服务模式[J].图书馆理论与实践,2015(2):96-99.
  杨方铭,章华.大数据环境下图书馆服务变革探讨[J].图书馆研究,2016(1):48-50.
  李艳,吕鹏,李珑.基于大数据挖掘与决策分析体系的高校图书馆个性化服务研究[J].图书情报知识,2016(2):60-68.
  刘晓娟,黄海晶,尤斌.语义网技术在图书馆数字资源深度聚合中的应用[J].图书馆杂志,2015(6):76-82.
  刘晓娟,黄海晶,尤斌.语义网技术在图书馆数据资源深度聚合中的应用[J].图书馆杂志,2015(6):76-82.
  熊拥军.数字图书馆个性化服务资源推荐模式分析[J].图书馆,2014(2):132-134.
其他文献
王威廉和陈崇正代表着80后广东作家群的最美收获。王威廉的《获救者》和陈崇正的《黑镜分身术》,二者同时关注到权力和资本运作背景下的失序状态。两位作家对风景、身体和记
一、架设临时用电线路时,必须经供电部门批准,并签订安全供用电合同,时间不超过6个月,使用完后应立即拆除。
如今,京城的老外已经突破10万人,七成以上是从事商务活动的。若是在几年前,北京的外国人去医院看病,也要和国人一样,排队、挂号、检查、划价、取药,一通忙活。现在简单了,北
论文使用Nvivo11和Excel对读者留言进行分析,得出高校图书馆读者服务存在的主要问题,以及读者对高校图书馆服务的主要需求。这些需求包括对图书馆信息资源的需求、对图书馆信息
【正】 随着中国经济的不断发展和新机会的不断涌现,现代风险与信用管理在工商业领域将逐渐变得愈加重要。有鉴于此,对外经济贸易大学之“格宁保险研究中心”,于11月首次与中
编辑同志:养牛是我村的一大优势产业,同时也是农民致富的重点项目。这次我们又计划联系从外地调运一批优良品种羊回来发展养羊业,请问在调运羊时应该注意些什么问题?山东栖霞黄
摘 要 本文分析比较了国内外公共图书馆总分馆服务体系主要模式,在此基础上提出了“十三五”期间省级公共图书馆服务体系的构建思路与服务工作的创新举措。  关键词 省级公共图书馆 总分馆 服务体系 读者服务  分类号 G252.3  DOI 10.16810/j.cnki.1672-514X.2016.08.005  Provincial Public Library Service System Co
摘 要 论文从科技传播形式和受传者的角度,分析机构知识库的用户群体,合理定位机构知识库价值,并在此基础上开发机构知识库服务功能。分别从科研人员、学生、决策管理人员、企业、图情人员和非专业大众六类用户的信息需求角度,细化机构知识库的服务功能,包括统计分析功能、交流功能和知识服务功能。并按用户的服务保证级别,对不同用户使用机构知识库的权限进行设置。  关键词 机构知识库 用户 信息需求 服务功能  分
【正】 As one of the world’s pioneers in mobile telecommumcations technology, Nokia is pleased to have the opportunity to contribute to the developmem Of Cmina
期刊