论文部分内容阅读
随着互联网和信息技术在各个领域的深入应用,存储在各个信息系统中的信息大量增加。一方面,这些信息分布广泛、管理自治和异构性强的特点严重阻碍了各个数据源之间的数据交换;另一方面,要求各个系统能够进行数据交换的需求越来越多。上述两方面的矛盾迫切要求实现各个数据源之间透明的数据交换,而不必考虑数据模型的异构、数据的抽取和合成等问题。由于传统的数据交换方式只能在结构层次上交换异构信息而没有解决交换信息的语义异构问题,因此大量对用户有价值的语义信息没有被利用。此外,当前国内外研究的重点是异构数据的集成,它一般只能提供集中式的数据查询功能,不能实现各个异构数据源之间的数据交换。
本文对异构数据源的数据交换及其语义异构问题进行了深入的研究。首先概述了数据集成的主要方式,说明了本体在数据集成中的优势与作用,分析了三种典型的基于本体的数据集成方式,讨论了它们的优缺点。接着在上面分析的基础上,借鉴共享本体的思想总结出基于局部共享本体的数据集成方式。它改变数据源与局部本体一一对应的映射关系,使用一个共享局部本体与多个相似数据源对应,解决局部本体过多的问题。然后提出了一种通用的、开放的、低耦合的数据交换模型。该模型利用基于局部共享本体方式的数据集成,为数据交换提供了一个全局的虚拟视图并解决语义异构问题;使用XML Schema(Extensible Markup Language Schema)定义所交换数据信息的统一格式,采用消息作为载体在各个数据源之间传递信息,保证模型与平台的无关性和开放性;同时支持请求应答和发布订阅两种数据交换模式,以满足多种数据交换需求。最后研究了本体及其映射的构建方法,并实现了一个本文提出的数据交换模型的原型系统。
论文的研究工作深化了数据集成的应用,初步解决了数据交换中的语义异构问题,为数据交换系统的实现提供了一种新的参考性框架。