论文部分内容阅读
信息系统在现代社会已经深入到各行各业中,在各自的位置上发挥着重要的作用。随着网络技术的发展,使得基于网络的资源共享成为可能,几乎每一个大中型公司和许多小型的公司,都越来越依赖于计算机化的信息。信息的共享改变了人们的传统工作方式,企事业之间,以及企事业内部的各个部门之间,可以通过信息共享的方式加强合作,从而提高工作效率。但是现在的问题是,由于原有信息系统开发环境和方式的独立性,形成了信息系统之间的数据和信息的异构性,很难进行通信和资源的共享,从而形成了一个个信息孤岛,成为困扰企业信息建设的主要问题之一。随着信息产业的蓬勃发展,由信息共享带来的不一致性,冗余等问题越来越突出。很多企业的信息化程度越高,信息孤岛就越多,信息共享所面临的问题也就越尖锐,这确实是一个挑战,是一个急需要解决的问题。异构数据集成,将系统内部和外部的不同结构的数据资源进行整合,是企业进行资源共享和实现产品数据管理(PDM)、企业应用集成(EAI)、企业资源规划(ERP)的技术基础。传统的方法是建立统一的数据模型,对异构数据提供统一的表示、存储和管理的方法,以此来提供统一的操作。虽然它能整合企业各种相关数据资源达到数据集成的目的,但是成本较高、过于复杂、难于维护,而且实现起来也有很大的难度。当前,实现异构数据集成的主流方式是通过网络进行数据交换,使用中间件来实现系统的松耦合集成。针对目前在这方面研究的不足,本文提出了一种基于 XML 的数据交换技术:即利用 XML作为中间件来对各种数据进行集成。将数据交换分为相对独立且相互关联的三个部分:即数据提取、数据映射和数据加载。其中数据提取负责将源数据库中的数据迁移到数据交换文件中;数据映射负责通过中间文件将源交换文件转换成目标交换文件;数据加载负责将目标交换文件中的数据迁入到目标数据库中去。文中提出了完整的系统结构图,详细的对它的原理,三个部分对应的数据提取工具、数据映射工具、数据加载工具结合图形进行了详细说明。最后结合实际对如何应用系统进行了阐述。随着信息化的逐步推进和信息量的飞速膨胀,数据集成的范畴会越来越广,对各种数据进行集成的要求也会越来越迫切。论文的开题来源于大庆石油管理局实际的项目,因此具有重要的理论和实际价值,希望对课题的研究能对异构数据集成的发展贡献微薄之力。