论文部分内容阅读
XML广泛应用于互联网的数据传输,在很多跨平台的应用系统中,也将它作为数据交换与存储的标准。它以自描述性和可拓展性等优越的特点正逐步成为数据交换与存储的重要标准。为了使XML能够更好的描述真实生活中的对象及它们之间的各种关联关系,有必要使用概念模型来对其建模。概念模型能够把真实生活中的各种事物抽象成为能够被信息系统识别的形式,然后再将其应用到计算机领域。良好的概念模型能够更好地体现XML本身的多种特性,也能为更加深入地研究XML的应用打下坚实的基础。本文在国内外XML概念模型的研究基础上,重点分析了XML概念模型的研究现状、现存问题及改进方法,针对扩展E-R模型不能较好的适应XML文档的层次化结构的问题,以模型驱动构架的思想为指导,在基本E-R模型的基础上作出适当的扩展,并结合层次模型的映射,提出了一种XML双层概念模型,这样既保留了扩展E-R的优点,又引入了层级结构,更好的体现了XML的层次化结构。在第一层中针对XML的不同特性对基本E-R中的实体等概念做出了相应的修改,并引入了数据节点类型、外向簇类型、内向簇类型等概念,同时对层次映射给出了形式化的表示,还在完整性约束中加入了顺序性这一约束条件,使模型更符合XML的特点。第二层就是将第一层中的某一部分层次化,使其在全局概念模型的基础上更好表示具体数据内容,一个层级结构就是将给定的全局概念层中的一部分层次化以后的详细描述。它不增加任何语义。所有的语义都用来描述层级结构概念层。然后提出了从全局概念层到层级结构概念层的转换算法。这两层之间存在着对应关系,需要通过转换操作,由全局概念结构映射转换得到层级结构。首先,从全局概念结构中选出关系类型和弱实体类型。对于这些被选择出来的类型,它们的层次化结构都是通过转换过程中对关系类型和弱实体类型的专门操作来构造完成的。然后,使用连接操作将这些层次化结构连接到一起。某些情况下,层次化关系类型可能会发生缩减,它的父亲和孩子可能会被合并成一个层次化实体类型。