论文部分内容阅读
企业信息化建设的不断深入使得企业存储的数据增长迅速且结构多元化,特别是半结构化/无结构化的趋势日趋明显。在信息化建设的长期过程中形成了大量自治分布异构的数据源,这些数据源无法资源共享制约了企业信息化建设的发展。重构这些数据源代价高昂且风险巨大。如何对已经存在的数据资源进行整合,实现资源共享,成为企业信息化建设中迫切需要解决的一个问题。多数据库系统能够将预先存在的、分布的、异构的、自治的文件和数据库系统组成一个协作的数据库系统并在不影响局部数据源自治性基础上,支持对物理上分布的多个数据源的全局透明访问。为了使多数据系统不依赖或服务于某一个特定系统,使其具有更好的通用性,本文设计了一种基于XML集成数据类型的面向服务架构的多数据库中间件,实现了多数据源模式映射,全局查询以及查询优化等功能并重点研究了多数据库全局查询处理及其优化算法的实现,针对中间件实现过程中遇到的问题进行了如下工作:首先,在分析了多数据库查询技术的国内外研究背景基础上,介绍了多数据库及其中间件等相关技术。对多数据库系统常用的公共数据类型进行了对比分析,并对多数据库中间件采用的公共数据类型做了模式映射研究,设计了模式映射中对象生成的算法。其次,对比分析了常用的多数据查询语言,结合需求设计了全局查询语言,介绍了查询分解,实现了查询分解的算法设计。对多数据查询优化进行了分析,在查询代价估算的基础上提出了本文的查询优化目标,采用了基于多元回归模型的动态优化策略实现了对全局查询调度后处理的优化。最后,基于.Net开发环境以面向服务的思想设计了中间件的架构,并在此架构中完成了多数据库中间件主要模块的设计开发工作,对中间件不足之处进行了分析并指出需要完善的工作。