论文部分内容阅读
随着计算机技术的普及,Internet技术的迅猛发展,企业间或企业各部门间需要数据共享的愿望越来越强烈。但这些数据源大多是异构的,无法直接进行数据交换,导致各企业的业务信息成为一个个的“信息孤岛”。要消除信息孤岛的问题,实现企业间的信息交换,关键就是要解决数据的异构性,并在此基础上建立一个统一的、安全的、稳定的数据交换平台和数据交换模型。由于本体技术可以通过对概念的严格定义和概念之间的关系来确定其精确含义,因此它具有描述数据源语义和解决语义异构的潜力,可以用于表示共同认可的、可共享的知识。本文在研究了本体技术和已有的关于数据交换以及数据集成的成果的基础上,提出了一种基于本体的数据交换系统架构,本体作为消除数据语义异构的工具应用到该系统中。论文的主要研究工作体现在以下几个方面:1)本文在研究已有的本体构建方法的基础上,从中选择了一种适当的方法,并采用了适当的本体描述语言,来进行手工构建全局本体,从而为数据交换提供了一个共享词汇库及词汇库里术语的关系。2)本文研究了从关系数据库生成本体的三种方法以及分析了现有的相关工具的优缺点,选择预定义规则法,实现了从关系数据库中自动生成本体。3)开发人员在设计数据库时,根据需要可能综合使用中文和英文去描述表名和字段名,因此本文自动生成的局部本体有可能是中、英文混合的。针对这一问题,本文在分析三种本体映射方法的基础上,通过综合使用基于语言学和基于结构两种方法实现了中文本体映射以及中英文混合本体的映射。4)对于查询接口方面,在国内外关于数据交换和数据集成的研究中,基本上都使用了类SQL语言作为查询语言,如SPARQL、OQL、XQuery、SQL等,这些语言对于使用者有一定的要求。针对这一问题,本文通过把数据库自然语言接口引入到数据交换系统中,使用户可以不需要或者只需要很少的培训就能够直接进行查询操作,大大降低了对用户的要求,减轻了用户的培训负担。5)本文采用OWL本体描述语言对本体进行建模,使用Jena2开发包对本体进行操作,通过一个典型的测试用例对本文提出的方法进行了验证。