论文部分内容阅读
数据资源是信息社会中最宝贵的资源之一;科学数据是e-Science 的重要基础。关系型数据通常是经过认真设计和仔细整理的数据,具有更高的价值。大量用户通过网络共享大量关系型数据的重要意义不言而喻。然而,由于资源发现、异构性、安全性等多方面的困难,目前用户一般无法通过互联网直接访问关系型数据库管理系统中的数据。传统的数据集成技术更适合于小规模和中等规模的异构数据库,现有技术的不足限制了大范围的关系型数据的共享。在科学研究领域,这方面的需求尤其突出。
本文的主要研究目标是在充分吸收国内外数据集成领域和数据网格领域研究成果的基础上,基于面向服务的体系结构,解决大规模关系型数据访问和集成的困难。针对这一研究目标,本文重点研究并提出了面向服务的关系型数据访问和集成中间件SODAIM的体系结构,然后,对数据访问服务和数据集成服务等关键技术问题进行深入的研究。SODAIM体系结构解决如何简化分布数据的访问和集成的问题;数据访问服务解决如何快速发布数据和静态访问数据的问题;数据集成服务解决如何发现、动态集成查询和获取数据的问题。
本文取得的主要成果如下:
●面向服务的关系型数据库的访问和集成中间件(SODAIM)体系结构基于对科学数据共享问题的需求分析和科学数据网格项目中的相关工作,提出了适应大规模分布数据库的集成访问需求的数据模型和查询响应模型,是这部分的主要创新点;融合面向服务的架构和中间件“Mediator-Wrapper’’架构并进行了扩展,提出了一种面向服务的关系型数据库访问和集成中间件(SODAIM)体系结构。SODAIM是一种新的松耦合的灵活的系统架构,能够更好的解决如何使关系型数据的访问和集成变得简单的难题。
●单节点数据资源的统一访问针对科学数据共享中数据发布和访问的需求,设计了数据访问服务 (DAS),把对一个节点的数据资源的访问封装为统一的服务接口,定义了包含元数据、检索、查询和浏览等操作的服务接口,并给出了核心功能模块的设计。DAS还为数据集成服务提供了关键性支持。DAS使数据提供者以统一、简便的方式快速的对外发布数据,提高了数据发布的效率;使用户以标准、透明、高效的调用方式获取数据,提高了数据访问的效率和易用性。
●多节点数据资源的集成访问在单个节点数据访问服务的基础上,研究对多个节点数据资源的协同访问和集成,设计了数据集成服务(DIS),主要包括全局元数据库的构造、查询分发、局部数据库的查询、结果集成和迭代精确查询等方面的内容,并讨论了服务实现的问题。数据库选择和局部不完全检索结果的集成是这部分工作的主要创新点。数据集成服务有效解决了大规模数据资源集成检索的难题。
●综合上述几方面的研究成果形成了一个比较完整和系统的关系型数据共享解决方案。部分研究成果已经在项目中实际应用并取得很好的效果。