论文部分内容阅读
随着Internet的发展,网络上存在着大量多样异构的数据库,它们的异构性表现在多个方面,主要有如下几个方面:1)计算机体系结构的异构,各个数据库运行在大型机,小型机、工作站、PC或嵌入式系统中;2)基础操作系统的异构,各个数据库系统的基础操作系统可以是Unix、Windows NT、Linux等;3)DBMS本身的异构,可以是同为关系型数据库系统的Oracle、SQL Server等,也可以是不同数据模型的数据库,如关系、模式、层次、网络、面向对象,函数型数据库;4)数据结构及语义异构,各个不同的数据库应用系统采用不同的数据结构和语义表达方式。随着企业信息系统的不断发展,越来越多的用户需要同时访问和处理不同网络节点的多个异构数据库的数据,希望屏蔽各个层次的异构特性,他们不必知道各个物理数据库系统的分布,也不必知道各个物理数据库的结构组成,不必自己去进行数据转换和结果汇总,只需通过简便的全局查询便可得到一个综合结果。因此,需要一种新的系统框架来解决多个异构数据库的信息共享,前提是必需对用户透明,并保持本地数据库的自治性。本文对当前的各种的集成方案进行了比较,最后提出了一种基于XML的集成模型。 本文首先对传统的异构数据集成方案进行广泛的调查分析,详细地讨论XML技术并与数据库作比较。提出了一种异构数据库信息共享框架,该框架包括翻译器、集成器和转换器,通过翻译器将关系数据发布为XML文档,然后通过集成器和转换器来提供异构关系数据库的XML全局视图,允许外部用户直接访问或使用XML查询语言查询这些视图。框架遵循定义的映射规范将关系数据库翻译为XML。本文的工作主要体现在三大部分:第一,讨论了数据库模式和DTD之间的映射机制并定义了XML-DB映射语言规范;第二,设计了三个组件翻译器、转换器和集成器来创建XML全局视图,以及视图管理器组件管理全局视图;第三,提供了Xpath和Xquery的编程接口,供用户查询XML全局视图。此外,拟采用Java语言开发中间件,能够方便地用来构建异构数据库的信息共享平台。