论文部分内容阅读
随着本体应用的不断发展,建立本体引擎,为各类基于知识本体的应用服务提供所需要的本体支撑,正在成为一种发展趋势。要构建这样一个本体引擎,首先要解决的一个问题是建立符合各种应用需求的本体。这可以通过以下几种方式来完成:
(1)建立一个能够满足多方需求的超级大本体;
(2)由不同的应用建立各自需要的本体内容;
(3)对现有本体中的适当内容进行复用,并在此基础上组建符合需要的本体。
其中,从现有本体中选取用户需要的部分并加以复用,正在成为本体研究者的一个关注点。本体模块化研究是该研究方向的一个重要分支,已有一些学者对本体模块化的概念、形式化描述、设计模式与选取方法等方面内容进行了较为深入的研究。目前在该项研究中存在着对用户不同角度与不同层次的本体需求考虑不足的问题,本论文针对这一问题,对本体模块化相关理论进行了探讨,并从粒度划分的角度出发,对本体模块化的一些关键技术提出了改进思路。
本论文的研究工作主要包括以下四个方面:
(1)对本体模块化相关基础理论进行了总结。主要包括以下四点:第一,本体模块的形式化描述。目前,对于本体模块有三种形式化的描述方式,即分布式描述逻辑、ε-连接和基于包的描述逻辑。第二,本体的模块化设计模式。多层次的本体设计模式和基于元模型的本体设计模式可提高本体的模块化程度。第三,本体的模块化选取方法,包括基于图(结构)的方法、基于e-连接的方法、基于推理信息的方法等。第四,本体模块化的关键技术,主要包括本体模块表示方法、本体模块选取方法和本体模块合并方法等。
(2)提出了一种基于粒度的本体模块表示方法。粒度计算是人工智能领域的一个新的研究方向,这种方法作为信息处理的一种新的概念与计算范式,主要用于处理不确定的、模糊的、不完整的和海量的信息。本体模块表示是本体模块化的关键技术之一,本论文将粒度计算方法引入到本体模块的表示中,同时结合印度著名学者S.R.Ranganathan提出的一种重要的分面分类法——冒号分类法,构建了一种新的本体模块表示方法。该方法针对从现有的OWL DL本体中选取模块的问题,提出从本体所具有的分面性与层次性出发,构造并解释本体粒子,并在此基础上形成了基于粒度的本体模块描述机制,可以帮助用户较为明确地表达本体需求。
(3)设计了一种通过粒度计算抽取本体模块的方法。本体模块选取方法是本体模块化的另一项关键技术,包括本体模块的划分与抽取方法。这两种方法只是应用场合不同,从技术方面而言并没有本质上的差别。本论文以基于粒度的本体模块表示方法为基础,提出采用概念词和关系词的分面层次权值,即一组介于O和1之间的实数值,来表示本体模块中的粒度特征,并从计算本体中概念词粒度权值的角度出发,引入了本体上下文的概念。在此基础之上,提出结合词汇学与上下文的特点,对本体进行粒度权值的计算,进而设计出按照粒度权值抽取本体模块的方法。按照这种方法抽取的模块可以在一定程度上满足不同用户从不同角度和不同层次上对于本体模块的需求。
(4)设计并实现了基于粒度的本体模块定制原型系统。该系统建立在基于粒度的本体模块表示与抽取方法的基础之上。利用该系统对选定的实验本体进行了模块抽取实验,并结合若干主要本体模块化工具对实验结果进行了对比分析,验证了基于粒度的本体模块表示方法与抽取方法的可行性和有效性。