论文部分内容阅读
随着分布式系统和网络技术的飞速发展,特别是上世纪90年代中期以来,数据源的数量不断增多,数据信息总量也以惊人的速率增长。然而,这些数据源分布在各种网络当中,存储在数据源中的数据信息为不同应用服务,其管理系统也各不相同。为了更有效地利用这些数据信息,需要从多个分布、异构和自治的数据源中集成数据,向用户提供一个统一的、透明的数据访问接口,屏蔽数据的差异性,同时还需要保持数据在不同系统上的完整性和一致性。
过去,由于异构数据集成面向的是传统的数据库系统,多数据库系统成为在不同成员系统之间实现数据共享和互操作的理想途径。但随着可共享数据源种类的增多和规模的增长,传统的数据库技术已无法满足用户的需求,异构数据集成从多数据库系统方向的研究向能集成文件系统等非数据库成员系统的研究方向扩展。在数据库系统中,数据都是结构化的,具有显式数据模式;而在文件系统中,存在大量如web网页的半结构化数据以及如文本文件和图像文件等非结构化数据,这些数据都不具有稳定的数据模式。
本文提出了建立“对象树”模型对异构数据进行集成的新方法。“对象树”模型能够实现对各种异构数据进行统一建模,避免了以往一些数据模型在对异构数据集成上的结构化偏重性,具有普遍意义。同时,“对象树”的核心是以对象的观点来处理数据,把数据内容和数据操作进行封装,提高数据的可操作性和利用率。在“对象树”模型的基础上,本文提出了一个具有普遍意义的、可操作性强的异构数据集成管理平台体系架构,并通过实例进行验证。
本文分五章对异构数据管理平台的研究和实现进行了论述。第一章介绍了异构数据的概念、异构数据集成的相关技术和现状以及研究的内容和意义。第二章建立了一种统一的数据模型——对象树模型(Object Tree Model),并定义了在该模型下各种异构数据与XML模式的映射关系。第三章提出了异构数据管理平台的系统结构的构建思路,给出了异构数据管理平台在数据查询方面的应用。第四章讨论异构数据集成管理平台的实现策略,包括平台的设计模式和数据中间件设计等。第五章,用一个数码相机销售公司的异构数据集成管理平台应用实例进行验证。最后对本文进行了总结,并提出了未来的研究方向。