论文部分内容阅读
随着Internet和信息技术的高速发展,XML数据的数量正在呈指数级增长,如何可靠、有效地存储管理XML数据已成为数据库研究领域中的一个重要挑战。本文在研究XML模式映射存储、混合内联算法、以数据为中心和以文档为中心的XML文档存储方法的基础上,对混合内联算法缺乏语义映射问题,提出了改进方案:改进的混合内联算法采用XML Schema模式,在XML Schema模式映射为关系模式的过程中,捕捉XML Schema中包含的默认值以及12种约束刻面(facts)等语义约束信息,并充分考虑XML数据的层次性、顺序性等特点,实现保持语义约束的模式映射;对两类XML文档存储方法提出不同解决方案:以数据为中心的XML文档,采用DOM进行解析,为每个元素添加顺序号以保持XML顺序的特性;以文档为中心的XML文档,采用SAX进行解析,以防止大数据量XML文档导致系统运行速度缓慢。以改进的混合内联算法为核心技术建立一个XML数据存储程序,此程序在存储过程中对用户透明,支持XML Schema模式与关系模式的映射,以及两类XML文档存储。通过在真实数据集上的实验结果可以证明本文研究的XML模式映射存储是可行的、有效的;并且可以说明改进的混合内联算法增强了关系模式与XML Schema模式的一致性,提高了存储数据的准确性,扩展了该算法的应用空间。