论文部分内容阅读
随着网络应用的快速发展,XML已经成为网络数据存储和交换的事实标准,越来越多的信息处理系统采用XML文档作为信息存储、交换和发布的载体。如何有效管理XML数据一直以来都是研究界关注的热点,其中的关键问题之一是设计支持XML数据更新和支持高效查询处理的编码方案。本文针对已有编码方案要么支持高效查询但不支持更新,要么支持更新但不支持高效查询的问题进行了深入的研究,主要研究内容如下。首先,针对扩展Dewey(ED)编码支持高效查询处理但不支持更新操作的问题,提出一种基于动态有限状态转换器(DFST)的动态扩展Dewey编码(DED)。DED编码既支持编码自身的更新操作,又可以避免当文档DTD(文档类型定义)发生变化时已有编码失效的问题,能够完整的支持XML数据的更新操作。进而,针对已有编码方案存储空间消耗过高的问题,提出一种基于霍夫曼编码的改进存储方案,减少编码存储的空间消耗。其次,针对扩展Dewey编码解析途径单一的问题,提出一种基于可逆有限状态转换器(RFST)的查询匹配算法EDTS。RFST通过代价模型选择编码解析策略,支持双向编码解析,提高编码的解析效率和查询处理的整体性能。最后,通过实验对DED编码的有效性和EDTS算法的高效性进行了验证。