论文部分内容阅读
数据集成的需求由来已久,对数据集成系统的研究一直是数据管理研究领域及其它相关领域一个非常热门的课题。如何找到一种灵活的、有效的方法,将原本分离、异构的数据源中的数据以无缝的、透明的方式集成起来?这个问题成为了数据集成领域内讨论的热点。
近年来随着XML技术的兴起和发展,运用XML来实现数据集成开始吸引越来越多研究人员的目光。XML作为一种数据格式描述的元语言标准,不断地被应用到各种不同领域的数据集成中去。XML的充足性、条理性、可扩展性和自描述性成为其作为数据模型描述语言的优势。对比于传统的数据集成技术,它更能满足系统灵活性和通用性方面的要求。本文从几种数据集成技术入手,分析了XML在这几种现有的数据集成方法当中的运用程度,并针对完全利用XML实现数据集成的框架作了进一步研究,基于现有方法的主体思路作了自己的改进与实现,主要工作如下:
(1)综述数据集成原理,陈述该领域的研究情况;
(2)对之前其他学者提出的基于XML的数据集成框架进行归纳,对异构数据处理能力、性能进行分析,将其中的共性和特性加以总结;
(3)基于数据集成框架原理,提出了一个完整的基于XML的集成框架。该框架在细节上有别于以往的集成框架,目的在于提供一种更为灵活、更具扩展能力的集成形式,作为现有理论的延拓。文中会对框架的每个环节给出具体的实现方法;
(4)阐述查询原理,运用Xquery进行查询建模,实现查询重构和执行;本文工作的意义在于提出了一个有别于以往集成思路的基于XML的数据集成框架,并从整体模型到局部模型,再到细节的数据定义都给出了较为详细的解决方案。为进一步在此基础上建立一个更为通用的数据集成访问架构奠定基础。