论文部分内容阅读
最近几年,语义网技术已经成为当前互联网技术研究的热点之一。其目标是开发一系列新的技术,改变现有互联网仅仅依靠文字信息来共享资源的模式,通过语义信息的共享,以及语义级的操作,来实现网络信息服务的智能化、自动化。本体层是语义网技术里最关键的部分。本体(Ontology)的概念最初起源于哲学领域,是“对世界上客观存在物的系统地描述,即存在论” ;在人工智能界,他们将本体定义为“给出构成相关领域词汇的基本术语和关系,以及利用这些术语和关系构成的规定这些词汇外延的规则的定义”; 如今本体应用于互联网研究领域,被定义成“本体是概念化的明确的规范说明” 。一个本体描述了一个特定研究领域的一个形式化的、共享的概念化模型。本体非常适合于描述互联网上各种不同的、分散的、半结构化的信息资源。通过定义共享的、通用的领域理论,本体帮助人和机器明确的交流,支持语义级的操作,而不仅仅是语法级的。本体中有三个基本的建模元语:类或概念、关系、实例。本文对本体的表示及本体层的建立做了深入的研究,采用了本体的XML描述方法。XML的语法和规范已经非常成熟,从数据的角度来看,它是一种使用适合特定需要的结构来表示任何信息的独立的全局方式。而且,XML允许创建,操作和显示根据特定的域问题标记的数据。如上所诉,在用XML描述本体时,可将本体的概念表示为XML的元素,而概念的属性则表示为子元素。同时关系也可以当概念来处理,它具有自己的属性。推理过程都是在本体层上进行的,所以根据所定义的本体层,首先要解析XML文件,把关系信息存入一个向量表中,然后进行搜索。深度优先搜索类似于树的先根遍历,是树的先根遍历的推广。宽度优先搜索类似与树的按层次遍历的过程。具有启发信息的搜索算法通过定义启发函数或利用关系的属性来优化搜索过程。目前,由于国际上还没有统一的语义网本体层和推理方法的定义,所以本文所使用本体层和推理的方法不是很具有普遍的意义,在其它某些领域可能有些不适合,可以说是对语义网的一种探索和研究。本论文的目的是实现一个面向特定领域的语义网系统。我们以软件自动化实验室为基本范围,包括其中所有的数据信息,在概念上主要定义了老师,学生,论文,备品,其它等几项,并且定义了其中概念实例间的相互关系,最后要完成简单的推理工作,提供有意义的推理结果。最终使用户在客户端发送请求,在服务端上执行相应操作,把结果返回<WP=51>给客户端,而且为了保证一致性,没有权限的用户不能修改本体。本文所设计的语义网系统模型釆用了五层结构:第一层为GUI层,主要是为用户提供一个图形用户接口,便于用户操作;第二层为操作层,主要完成本体上的编辑,查询,推理等工作;第三层为本体层,主要是保存本体信息,并响应来自操作层的请求来对本体信息进行操作;第四层为解析层,主要是完成数据库表和XML转换以及编辑XML文件工作;第五层为信息库层,以数据库表形式存储具体的信息。此外系统中主要技术包括Java2技术在系统中的应用,MVC模式在实现中的应用,以XML文件形式为本体建模及本体模型的Java解析过程。Java 2平台包括一系列相关技术,为编出可移植的、面向对象的、安全的Internet应用提供了一条快速成熟的途径。MVC是一种先进的设计模式,它将一个程序拆分成三个部分:模型、视图和控制器。在本体层上实现查询和编辑功能时,用到SAX类和DOM类。SAX类解析XML文档,就是一个事件的驱动,按条件执行相应事件的内容,当进行查询时,可以设定条件语句,把查询完成的结果存入适当的数据结构中,返回给用户。由于SAX类是事件类驱动,不能对XML文件进行编辑,所以我们使用DOM类。DOM是一种规范,定义了一种接口,通过它可以对文档的不同部分进行访问,定位它们并对其进行更改。DOM类执行过程首先将XML文档的内容读入内存,然后再重新写XML文档,达到编辑的作用。在特定领域内,两个概念实例很可能都有千丝万缕的联系,并且很可能根本就不能直接确定两者之间的具体关系,因此,推理工作不能提供给用户过多无用的信息,要合理地优化推理路径,提供给用户有用的解路径。综上所述,本文介绍了语义网研究背景与当前的研究状况,并在语义网研究的本体描述领域,语义网模型领域做了深入研究。本文通过对本体描述深入研究,采用了以XML语言来描述本体的方法,这种方法具有较好的描述效果与较好的通用性。在此基础上,实现了语义网模型中的本体层,并完成了在其上的简单推理工作。本文设计并实现了基于本体的语义网模型系统,以本体作为语义网中的语义信息层,可以实现语义信息的共享,这样就可以提高信息服务的智能化和自动化程度。而推理过程在本体层之上,因而也完成了对数据的语义操作,提高工作的效率。进一步的工作是优化推理功能的研究,和对互联网上本体的控制机制的研究。