论文部分内容阅读
XML(eXtensible Markup Language)作为一种Internet上的主要的数据表示和交换标准之一,应用范围非常广泛。但是由于XML文档的模式DTD在设计上存在不足之处,DTD中可能存在一些异常的数据依赖,从而导致XML文档包含冗余的数据而出现操作异常。本文研究了以DTD为模式的XML文档的规范化问题,主要研究内容包括如下三个方面: 1.在这一部分,首先通过分析函数依赖的表现形式在XML文档中和在关系数据库中的不同,提出了基于DTD路径表达式的XML文档的函数依赖的概念。这种函数依赖不仅能表达元素的属性和元素的值之间的函数依赖,而且也能表达元素之间的函数依赖。它可以有两种不同类型的表现形式:绝对函数依赖和相对函数依赖。然后给出了关于XML文档的函数依赖的一组完备的推理规则集。最后还进一步研究了XML文档的函数依赖和键的关系。 2.在这一部分,首先提出了关于XML文档的间接函数依赖和传递函数依赖的概念,并且基于这两个概念,提出了XML文档的一种范式XNF-1。另外,在这一部分,还提出了XML文档的另一种范式XNF-2。然后通过用DTD的关系表示形式给出了DTD无损联接分解的概念。最后给出了把一个XML文档的DTD无损联接地分解成符合XNF-1和XNF-2的两个算法。 3.XML文档中可能包含由非函数依赖引起的数据冗余和操作异常。在这一部分,提出了以DTD为模式的XML文档的多值依赖的概念。然后基于多值依赖的概念,提出了XML文档的另一种范式XNF-3。最后给出了把一个XML文档的DTD无损联接地分解成符合XNF-3的一种算法。