基于本体和XML的异构数据集成研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:Michellesy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web的迅猛发展,因特网上的资源越来越丰富,已经成为一个巨大的全球化信息仓库。Web上的资源不仅包括传统的有严格数据模型的数据库,如关系数据库和面向对象的数据库,而且还包括无结构和半结构的数据,如大量的HTML文档、XML文档和文本数据。这些分布在各处的数据资源,在其设计阶段,主要是为了满足各自的业务需要而形成的,由于软硬件平台及数据模型的不同而成为了异构数据。异构数据互相之间难以集成和共享,使各数据源间的互操作变得困难,无法实现信息的共享和有效利用,从而成为“信息孤岛”。为了更好地利用网络上浩如烟海的信息,人们迫切需要集成这些地理分布、管理自治、模式异构的数据,因此异构数据集成问题吸引了众多关注。在本文中,先全面地分析了现有的数据集成方式,异构数据集成的相关理论和技术。然后指出了当前异构数据集成的主要问题是语义异构问题。在此基础上提出了一种基于本体和XML的异构数据集成系统模型,用来解决语义异构问题。设计了基于本体和XML的异构数据集成模型,并对模型中的关键模块进行探讨。本体的引入是为了解决异构数据集成中的语义异构。本文的研究主要有以下几点:(1)探讨了异构数据集成中的相关理论和技术。分析了现有的数据集成方法,指出了当前的数据集成中急需解决语义异构。(2)通过对已有的数据集成系统体系结构的研究,结合XML技术、本体技术和Web Services技术,提出了一种基于本体和XML的异构数据集成模型。对此模型中的功能模块给出了详细的描述,并对关键模块进行了测试。(3)采用XML作为中间语言,将各局部数据源数据转化为XML数据模式进行集成,从XML Schema上构建局部本体,从而屏蔽底层数据源的语法的异构性。(4)利用本体描述领域概念的优势,采用本体描述语言OWL构建全局本体和局部本体,同时定义了全局本体和局部本体的映射,局部本体和数据源的映射规则,解决数据集成中存在的语义异构问题。(5)将各个异构数据源包装器封装为Web Services,使系统具有松耦合、灵活、易扩展的良好特性,能真正实现异构数据源的无缝集成。(6)采用XQuery作为全局模式上的查询语言,容易实现对XML数据的查询。对针对全局模式(全局本体)的全局查询语句进行分解,分解为针对局部本体术语表示的子查询语句。
其他文献
T-Kernel作为一种嵌入式操作系统,由于实时性和开源性,在嵌入式操作系统领域中的应用越来越广泛。ARM是一款比较好的微处理器,T-Kernel在ARM上的应用研究基本上是空白,所以结
分形理论是近二、三十年才发展起来的一门新的学科,它主要描述自然界中的非线性系统中不光滑和不规则的几何形体。传统的欧氏几何主要研究规则图形和光滑曲线,对自然植物的描
随着Web应用的日益广泛,需求的变化也越来越多,用户希望提升操作体验,企业希望能够降低软件开发费用、最大化现有技术的利用、快速应对业务决策的改变。而以传统的方式来开发
随着计算机应用范围的扩大,需要计算机处理的数据量也越来越大,在很多领域里,常采用OMR(光学标记阅读机)来解决大规模数据的采集、识别和录入的问题。虽然OMR解决了一些填涂信息
面向对象模型是基于面向对象的设计方法而建立的模型,是面向对象的核心思想,它模拟人的思维方式,尽可能地使程序的结构和实现与其所描述的现实世界保持一致,亦即充分保证计算
随着互联网技术与应用的迅速发展,Web服务作为部署在互联网上的组件,展现出良好的封装性、松耦合性以及跨平台性。因此,Web服务迅速成为了人们关注的焦点。近年来,互联网上出
随着web的迅速发展,人们从互联网上可以获取资料变得越来越多。与此同时,互联网也以其巨大的信息量给人们带来了前所未有的冲击。在用户利用web搜索引擎查找信息的过程中,往往出
无线传感器网络是一种新型的、无基础设施的、自组织的无线网络。近年来随着微电子技术、传感器技术及通信技术的发展,无线传感器网络技术发展迅猛,进展很快,而且在军事与民
Web2.0作为新一代互联网时代有着比Web1.0时代更为鲜明的特征和更广泛的用户群。在Web2.0浪潮迅猛发展的过程中,数据库管理已经成为各大Web2.0公司的核心竞争力。因此,开发基
计算机辅助设计开始发展于20世纪60年代,在工业设计中扮演着非常重要的角色,已经广泛的应用于工业设计的各个方面。随着科技的发展与时代的进步,人们对产品外观造型的要求逐