论文部分内容阅读
制造业信息化的基础平台将是Internet/Intranet,XML(Extensible Markup Language,可扩展标记语言)已经成为Internet/Intranet环境下数据表达的事实标准,而目前企业大量数据仍存在于占主导地位的关系数据库(Relational Data Base,简称RDB)中,如何在RDB与XML之间架起数据交换与数据操作的桥梁,已成为制造业在Internet/Intranet环境实现信息化迫切需要解决的突出问题之一。针对这一问题,本文提出了“以RDB为底层数据存储载体、通过建立XML视图进行数据交换及直接Internet/Intranet应用”的双重数据管理机制的构想。基于此构想,深入研究了XML与RDB的多层次双向数据集成技术,旨在通过两者之间的静态数据转换、动态数据检索、同步数据修改等多层次数据处理技术的研究,实现企业RDB数据与Internet/Intranet标准XML数据的双向集成。论文的主要研究内容如下: 1.保留语义约束的XML与RDB双向静态数据转换技术 现有研究大多采用DTD(Document Type Definition,文档类型定义)作为XML的模式描述语言,并且在模式映射过程中丢失语义约束信息,本文分析了XML-Schema(XML-Schema采用与DTD完全不同的语法,数据描述能力更强同时也更为复杂,已被W3C确定为替代DTD作为XML模式描述语言的标准)及关系模式的语义约束特征,通过基于正则树的XML形式化描述方法以及基于有向图的一般关系模式表示方法的研究,建立保留语义约束的XML-Schema与关系模式的双向模式映射算法,实现了XML与RDB的双向数据转换,较好地解决了XML与RDB在静态数据转换层面的数据集成问题,可有效满足企业大量RDB数据面向XML的发布以及与日俱增的XML数据存入RDB的应用需求。 XML与RDB之间的双向静态数据转换也为构建“双重数据管理机制”奠定了基础,使用户能够面向XML视图通过检索、修改等方法操作底层RDB数据。 2.通过XML视图动态检索底层RDB的技术 建立基于RDB的XML动态检索机制;针对现有动态检索算法大多依赖静态模式映射算法的问题以及基于W3C工作草案XQuery的研究尚无实质性进展的现状,通过提出并建立GVRS(General Virtual Relational Schema for XML Document)模型,作为XML事例文件与RDB之间的桥梁,实现了一种与静态模式映射“无关”的XQuery到SQL的转换算法,保证动态检索对各种静态转换的普遍适应性,实现了通过XML视图对底层RDB的动态数据检索,较好地解决了XML与RDB在动态检索层面的数据集成问题,可有效满足根据用户需要有选择动态检索系统底层RDB数据的需求。 3.XML视图与底层RDB的同步修改技术 针对国内外尚未系统l展XML修改及其与pB集成后的同步修改技术的研究现状,提出一种XML修改语言原型XUL(XML Update Language人 研究了 XUL与 XQuery的语法融合方法;通过设计 XUL到 SQL的转换方法及其同步执行机制,实现了XML视图与底层RDB数据的一致性;提出了“主动修改”的概念并讨论了其实现的关键技术。为XML与pB在同步修改层面的数据集成提供了有效的技术手段,可满足用户通过XML视图修改底层pB的应用需求。 4.通过软件原型系统的实现及其在企业中的应用,对关键技术进行验证 设计并实现了一个XML与pB多层次双向数据集成中间件软件原型系统(Bridge-XMLRDB,Middleware like Bridge between XML and RDB),对本文的研究思路及关键算法进行并通过了仿真验证;以企业应用集成为背景,讨论了XML与RDB多层次双向集成技术在制造业信息化过程中的应用模式和方法。 本文受到国家863高科技发展计划(编号:863-551.942.007,2002AA414210)和国防十五预研项目(41318.1.1.5)的联合资助,反映了作者从 1999年以来的主要研究成果。从总体技术上讲,提出并系统研究了XML与RDB多层次双向数据集成技术,将XML与RDB的数据集成从静态数据转换、动态数据检索推向同步数据修改层面。从关键算法上讲,静态转换层模式映射算法在数据结构合理映射的基础上实现了数据语义约束的完整保留,具有“无损性” 的特点;动态检索层实现了与静态模式映射无关的XQuery到SQL的转换,消除了现有方法对静态模式映射算法的依赖,具有“无关性” 的特点。另外,本文注重XMLSchema、XQuery等国际标准的采用,虽增加了研究的难度,但使得研究成果更具生命力。