论文部分内容阅读
随着互联网与网格的发展,许多应用开发中遇到了数据分布在不同的地点的情况,而且这些数据存在着异构性,不但在数据存储上不同的,在信息表示上也不同。为开发应用需要对这些分布式的异构数据进行有效集成。同时由于在这些数据的基础上已经开发了各种应用系统,所以在对数据进行集成时要求不能影响已有的系统。数据集成的目的是实现对分布式异构数据的有效集成和透明访问,而不改变原有的数据。数据集成中数据提供者希望能方便地将数据发布出去供集成,并要求保证自身数据源的安全性,数据使用者希望通过数据集成能透明访问需要的数据,而不必了解太多的细节。
针对分布式异构数据集成的特点和要求,在OGSA-DAI的基础上,本文设计和实现了一个数据集成中间件,满足各方面的要求,实现对异构数据的有效集成。本文首先分析了数据的异构性和数据集成中各角色的特点要求,以及数据集成的模式,进而提出了一种有效实现异构数据集成的方法。对于各数据源中数据的异构性,设计实现了数据服务来进行屏蔽,在指定信息描述标准的基础上,提出了通过映射的方法解决数据在信息表示上的异构性。根据信息描述标准将数据源中的数据映射到一张虚拟数据表中,数据源中数据与信息标准之间的映射关系保存在数据服务中的信息映射表中,这种映射关系可以动态改变,用户通过数据服务对虚拟表进行查询。为将对关系数据库和XM L数据的查询相统一,本文提出了一种简化SQL语言SIN-SQL,用户使用SIM-SQL对虚拟数据表中进行查询,数据服务在真正访问数据源时需要将SIM-SQL转化为SQL或XPath,这种转化依据信息映射表进行,同时对于从数据源获取的数据,根据信息映射表进行格式的转化,本文中给出了这些转化的具体算法,最后通过数据服务传递给用户。由于数据服务具有标准的Web Service接口,从而实现了对数据源的细节信息隐藏,达到对数据源的透明访问。本文中还介绍了一个数据服务开发部署工具,说明了如何通过这个工具将数据源封装为数据服务并部署发布出去。
文章中介绍了建立的信息发布中心,其实现对实体信息标准描述的建立和发布,以及对数据服务的分类、注册和管理。最后,介绍了数据集成中心的设计和实现,数据集成中心实现对多个数据服务的数据集成,数据集成中心将原分布式的异构数据有效的集成起来,对用户提供数据集成访问,隐藏了数据源的细节,提供对分布式异构数据源的集成和透明访问。