论文部分内容阅读
对XML数据类型、模式的关系和XML文档的合并,人们做了大量的研究工作,但是这些研究工作还存在着一定的局限性,如KUPER和SIMEON提出的XML模式的子包含关系,只就两个XML模式之间的子包含关系进行了研究:TUFTE和MAIER提出的XML文档的合并方案,以对合并XML文档建立模板为前提,操作起来比较不便.该文对XML数据类型、模式和文档进行了进一步的研究,所做的主要工作和取得的主要成果如下:1、XML文档和模式的结构模型.传统的XML文档的模型为三元组树状模型,该文在此基础上提出了XML文档和模式的五元组模型,即XML的根、标记集合、对象集合、结点与标记的关系集合、结点间的关系集合,基于五元组模型可以更方便的描述XML文档和模式的构状结构.2、XML模式之间的关系.在XML模式子包含关系的基础上,该文提出了XML模式之间的部分包含关系、XML模式集之间的多对一的包含关系;利用格理论,讨论了具有部分包含关系的XML模式的最小上界,研究了部分包含关系的XML模式的模式合并问题,并提出了相应算法,讨论了算法的时间复杂性,利用该算法进行了XML数据查询的探讨.3、XML文档的合并方法.一般的XML文档合并,先根据需合并的文档的特点,建立相应模板,利用模板进行XML文档的合并,以保证XML文档合并结果的唯一性.该文提出的XML文档的合并方法是基于相应文档的XML模式,且模式之间存在部分包含关系;通过在XML模式中自定义主键数据类型,用来对需合并的文档进行约束,在合并时进行相应数据类型的转换,保证合并文档的唯一性;该方法可以自动处理不需事先定义模板,有较好的自适应性.4、用XML进行多数据源综合查询的应用实例.根据对XML数据类型、模式及文档合并研究的结果,结合税收工作的实际,对实际工作中多数据源的数据查询问题,充分利用XML模式的部分包含关系、模式合并和XML文档合并的方法,设计了一个应用实例,解决了工作中遇到的实际问题.