论文部分内容阅读
长期以来,网络上存在着大量异构的数据库,它们的异构性表现在多个方面,如数据的类型不同,数据的表示不同,管理数据的软件不同,以及系统运行的环境不同。随着企业合作和政务电子化的发展,许多信息系统需要访问这些异构数据库中的数据。因此,需要一种新的系统框架来解决多个异构数据库的信息集成,其前提是必须对用户透明,并保持本地数据库的自治性。 可扩展标记语言XML具有很强的结构和语义表达能力;利用XML进行数据集成具有很好的扩展性。XML已经成为Internet上企业应用的标准数据交换格式,它的可扩展性使得建立不同数据源数据集成的通用模型变得容易。利用XML建立异构数据库集成模型的关键是建立XML与数据库之间的映射关系。目前XML有两种映射方法是非常普遍的:一种是基于模板的映射方法;另一种是基于模型的映射方法。以上两种方法都存在着一些局限性,第一种方法只支持从关系数据库到XML文档的单向映射,第二种方法对XML文档的结构有一些限制。 本文在研究现有的基于XML的数据映射算法和模型的基础上,对传统的异构数据集成技术进行了比较分析。提出了一种基于元素树的数据映射方法,该方法可以高效地实现XML文档与关系型数据的相互转换。另外,我们还实现了一个XML文档与关系数据库数据相互映射的系统XDWrapper,XDWrapper提供异构关系数据库的XML全局视图,允许外部用户直接访问或使用XML查询语言查询这些视图。该系统映射规则简单并能最大限度地屏蔽数据库的异构性。