论文部分内容阅读
随着信息化建设的迅速发展,越来越多的应用需要访问多种异构数据源。这些数据源由于地理位置分布不同、所处平台及操作系统不同、采用的数据库模式不同、数据语义表示的不同、数据库管理系统(DBMS)的不同等,造成了数据访问上的困难。因此,如何应用现有的信息技术,动态整合与集成这些异构的数据资源,实现高效的信息共享是亟待解决的问题。数据集成能够满足不同业务的需要,实现对异构数据源的共享及数据的透明访问。目前,数据集成有很多方案,然而这些方法不但复杂而且是面向主题的。传统数据库中间件虽然显得比较灵活,但其紧耦合应用模式使得中间件独立性差,部署与使用较为困难,难以用于信息系统的集成。如何构建一个高效、通用、可扩展、低成本的数据库中间件,是当前数据库中间件领域研究的一个重要方向。本文以XML在数据集成和交换上的优势,提出了一个基于XML的异构数据库集成中间件的解决方案。本文首先讨论了异构数据集成的相关知识,详细分析了现有的数据集成技术和方法、并对比其优缺点。通过XML集成模型,着重阐述了基于XML的异构数据库集成中间件的设计思路和各个功能模块的实现过程。通过实现局部模式到全局视图的的映射、转化、集成,该中间件屏蔽了各个异构数据源的平台、系统环境、内部数据结构等方面的异构性,为用户提供了一个统一和透明的访问接口。同时,在异构集成环境下如何更好地解决各个子库之间的跨库查询,交叉查询、联合查询等复杂关联的查询,是本课题研究的重点和难点。为此,在讨论集中式数据库和分布式查询的一般方法后,本文给出了一种针对全局虚拟视图的查询分解算法,该算法能够很好解决多库之间的关联查询请求。由于集成系统涉及到大量的数据传输,在有限的网络资源环境下,如何减少数据在传输中的数据量?如何降低查询的响应时间?这些都是必须考虑的问题。在基于半连接查询优化算法的基础上,本文对该算法进行了改进,通过定性和定量方面的分析,改进的半连接算法比一般的半连接算法在传输的数据量和响应时间方面都大为减少,性能更为优越。最后,通过实验实现了基于XML的集成中间件系统,应用表明,基于XML的集成中间件能够更好的集成异构数据,实现资源的共享,提供高效、透明的访问。