基于NeOn Toolkit的本体重用方法实例研究

来源 :图书与情报 | 被引量 : 0次 | 上传用户:zz_davidli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:文章通过使用NeOn Toolkit工具,以从ASTRA项目获取到的本体实例为分析对象,实现了自动化的本体重用,并利用SPARQL对重用后目标本体的继承和推理一致性进行校验和确认,最后分析目前针对大规模本体重用存在的问题。
  关键词:本体重用 NeOn Toolkit ASTRA项目 SPARQL
  中图分类号: G254.0 文献标识码: A 文章编号: 1003-6938(2013)01-0013-04
  网络技术的应用为人们提供了极其方便的信息服务,改变了人们获取信息的途径和方式,也改变了很多人的生活方式。但是随着信息数量的增长,网络信息的有效组织和语义理解已成为亟待解决的问题。本体技术是解决上述问题的有效途径,本体可将所有信息的元数据进行统一的表示,实现网络信息的语义化表达。但是本体的建模与开发本身是一项系统性较强、投入量较大的工程。通过重用已有的本体,能够减少系统的开销,避免重复建设。重用的思想和理论,在软件开发领域已经比较成熟,但是对于本体这种特殊知识表示形式的重用,还属于比较前沿和新兴的研究内容。
  本文通过使用NeOn Toolkit工具,以从网络获取到的本体实例为分析对象,实现自动化的本体重用,并利用SPARQL对重用后的本体实现语义推理,最后分析目前针对大规模本体重用存在的问题。
  1 NeOn Toolkit介绍
  2006年,由14个欧盟机构参与、受欧盟第六框架计划资助的NeOn(Networked Ontologies)项目开始研究如何有效利用本体实现分布式大规模语义应用,并发展了本体工具和相应方法。NeOn Toolkit是NeOn项目开发的基于Java的开源本体编辑工具,NeOn Toolkit平台及其丰富的插件可以帮助本体开发人员和本领域专家完成各种各样的本体工程活动,包括注释和文档、人机交互、模块化和定制、本体调试、本体动力学、本体评估、本体匹配、本体论规范、推理及重用等。目前最新版本是2011年12月推出的NeOn Toolkit-2.5.2[1]。
  在NeOn Toolkit中,对OWL语言描述的本体,从概念(Classes),对象属性(Object Properties),数据属性(Bata Properties),注释(Annotation Properties),数据类型(atatypes)五个方面加以描述(见图1)。
  本文主要以Location和Building本体为例,结合本体管理的实际需求,利用NeOn Toolkit平台丰富的功能,实现本体重用与本体推理。利用NeOn Toolkit实现地理位置本体的管理,比利用关系数据库存储地理信息有着明显的优势:NeOn Toolkit支持简单的逻辑推理,还支持复杂的知识表达,因此,它更接近人类的知识表达;而数据库数据实例和列名定义是相互独立的,数据结构建模较为单一,无法全面表示实例之间复杂的隐性关系。
  2 本体重用简介
  在人工智能界,最早给出Ontology定义的是Neches等人,他认为“本体定义了组成主题领域的词汇表的基本术语及其关系,以及结合这些术语和关系来定义词汇表外延的规则”。但其中最著名并被引用得最为广泛的定义是由T.Gruber提出的“本体是概念化的明确的规范说明” [2]。本体的作用就是对客观世界进行抽象的描述,并实现概念层次的统一性。本体和本体工程吸引了来自不同领域的学者和研究人员,已经逐步成为信息领域的一个研究热点。
  从零开始构建本体是一项需要大量投入的工程,随着信息技术的发展,本体在自然语言理解、知识表示与获取、数据集成和信息检索等多个方向上得到了广泛的应用,越来越多的人研究本体,网络当中的本体数量与日俱增,本体重用就是根据不同实际需求,利用这些已有的本体,构成新的本体的过程。通过以后本体的重用,能够减少系统的开销避免重复建设。本体重用的思想和理论是近年发展起来的,属于比较前沿和新兴的研究内容。国内外在该领域的研究集中在:本体模块化、本体上下文、本体演化、本体缓存与语义缓存等方面[3]。本文则主要是利用NeOn Toolkit平台,实现本体重用的实践过程。
  3 利用NeOn Toolkit实现本体重用
  本文实现本体重用的过程,选择了ASTRA 项目当中产出的Location和Building两个本体作为源本体。由Ioannis Zaharakis担任项目经理的ASTRA项目旨在通过建立泛在认知系统框架,用以支持对人类社会关系的建模。该框架包括指导并支持社会交流的泛在认知系统设计和评价的理论,以及支持该系统应用的工具和服务[4]。其中Location和Building两个本体在系统中用以定位人类社会活动的位置。本文通过对这两个已有本体的重用,阐述利用NeOn Toolkit平台本体重用的过程,并对重用后产生的目标本体,进行逻辑推理及查询。本文采用的方法适用于各种OWL格式所描述的本体数据。
  3.1 实验环境配置
  首先,在计算机当中配置Java运行环境。
  然后,分析用于重用的本体资源。在本文中选用的位置本体Location.owl将地理位置信息概况为以下几个关键概念:Continent、Federation、Country、Province、City、Quarter、 Building 、Room、Place,并且辅以属性、关系、实例等相关信息的描述(对于Location.owl的关键概念之间上位superlocation_of、下位sublocation_of以及继承isa关系描述见图2)。
  对于Location.owl中的building概念,可以为其添加更为丰富的语义关系,所以选用Buliding.owl本体,将Location.owl和Buliding.owl整合为一个新的目标本体(对于Buliding.owl的关键概念之间的关系描述见图3)。   3.2 本体重用过程
  调用NeOn Toolkit,将Location.owl和Buliding.owl作为源本体输入本体整合程序(整合操作见图4,整合后产出的目标本体层次结构及上下位关系见图5)。目标本体对原来Location本体中的building信息进行了扩展,所以对地理位置信息的描述更加精确,在包含了Buliding.owl中信息之外,同时对上位、下位及继承关系都做了重新调整。
  对于目标本体,为了测试其是否保证了推理逻辑合理性,可以使用NeOn Toolkit的推理测试功能。NeOn Toolkit平台支持标准本体查询语言SPARQL (Simple Protocol and RDF Query Language),允许用户通过SPARQL语法查询本体。SPARQL是为RDF开发的一种查询语言和数据获取协议,它是为W3C所开发的RDF数据模型所定义,但是可以用于任何可以用RDF来表示的信息资源[5]。
  根据目标本体关键概念、属性及实例关系,设计以下的推理测试用例:
  (1)为目标本体中的关键概念Person添加实例A和B(添加方法见图6)。
  (2) A和B的办公地址实例分别为(添加方法同图6):其中,Room与Building存在sublocation_of关系,Building和City存在sublocation_of关系。
  采用SPARQL对目标进行查询,代码如下:
  输出推理查询的结果如下:
  从以上结果中可以得出:在City 概念实例Beijing的人有A和B。
  由于A的声明中并无城市描述,推理机通过对目标本体的推理,实现了关于A所在城市的推测。重用后的本体符合简单推理规则,由于篇幅有限,对于目标本体的推理测试仅举一例。然而对于对大规模本体重用来说,由于关键概念之间的关系错综复杂,这就为对目标本体推理规则的设计带来了困难。现在在本体重用这一领域,还没有完整的关于推理测试的形式化的表示和操作方法。可见,对于大规模本体重用,推理规则的设计仍有待进一步研究。
  4 结语
  随着网络信息的急剧增长,对网络信息的有效管理成为人工智能及网络信息技术等领域的研究热点。本体作为客观世界概念化的明确的规范说明,是解决信息组织及语义表达问题的有效途径,但从零开始构建本体的工程量非常巨大,所以对已有本体的重用是提高本体利用效率的有效方法。本文以ASTRA 项目当中产出的Location.owl和Building.owl两个本体作为源本体,通过使用NeOn Toolkit平台,实现自动化的本体重用,并利用SPARQL对重用后的本体实现语义推理,实验结果证明利用本文方法实现本体重用方法有效。但是,对大规模的本体重用的研究还不十分成熟,尤其是对于重用后的本体推理问题的研究,缺乏深入的探讨,以及完备的测试方法。
  参考文献:
  [1]Welcome to the NeOn Project [EB/OL]. [2010-02-24].http://www.neon-project.org/nw/Welcome_to_the_NeOn
  _Project.
  [2]Gruber T R. A Translation Approach to Portable OntologySpecifications[J].Knowledge Acquisition,1993,(5):199-220.
  [3]毛郁欣. 面向大规模本体重用的子本体模型研究[D]. 杭州:浙江大学,2008.
  [4]ASTRA Platform and End User tools code now available[EB/OL]. [2009-12-14] http://www.astra-project.net
  [5]SparQL[EB/OL].[2012-05-28].http://baike.baidu.com/view/661304.htm.
  作者简介:毕琳(1984-),女,中科院国家科学图书馆博士研究生,长春理工大学计算机科学技术学院讲师;张莹(1982-),男,博士,中科院长春光学精密机械与物理研究所工程师;纪姗姗(1986-),女,中科院国家科学图书馆馆员。
其他文献
高职院校的学生往往在学业、情感、交往及成就上容易产生挫折。如何提高其挫折承受力,便是保证高职院校学生能否顺利、高质量完成学业的关键。正确对待挫折;社会、学校和家庭要
文章在文献调研的基础上,通过理论与实验结合的方法讨论了基于关联规则的术语抽取方法的合理性和可用性。从理论上看,关联规则的基本原理决定了它在充分解决'序'的条
随着社会主义市场经济体制的建立和国家干部制度、人事制度改革向纵深推进,成人高等学校的学历教育在生源结构、办学形式等方面发生了很大的变化,对学校的德育工作提出了新的要
馆员在图书馆的资源采购工作中扮演着重要的角色,特别是采访馆员及学科馆员,是馆藏建设的核心力量之一.近年来一种全新的采购模式——读者决策采购(PDA)对这种权威地位提出了挑
发展包括成人教育在内的继续教育,构建终身教育体系,是全面建设学习型社会和小康社会的必然要求,该文分析了成人高等教育实行学分制的必要性和紧迫性,并对实行成人高等教育学分制
PDCA法是程序化、标准化的一种科学工作方法,即通过计划(P)、实施(D)、检查(C)、处理(A)4个阶段来进行。自2001年以来,我院将PDCA循环管理运用于一次性用品无害化处理的管理工
随着住房公积金贷款的普及和公积金存款的不断增加,各地"存贷矛盾"逐渐显现,在经济发达地区公积金存款"积压"严重,在经济欠发达地区公积金贷款供不应求。但是不管是处于哪种情形,
随着人们生活水平的提高,人们对住房需求也呈现多样化的趋势。房地产营销中,差异化营销也就成为必然。而实施差异化,就需要进行深入的市场细分。概念营销是成功的市场细分的表现