基于动态XML文档的编码及查询处理关键技术研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:xh7304
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络应用的快速发展,XML已经成为网络数据存储和交换的事实标准,越来越多的信息处理系统采用XML文档作为信息存储、交换和发布的载体。如何有效管理XML数据一直以来都是研究界关注的热点,其中的关键问题之一是设计支持XML数据更新和支持高效查询处理的编码方案。本文针对已有编码方案要么支持高效查询但不支持更新,要么支持更新但不支持高效查询的问题进行了深入的研究,主要研究内容如下。首先,针对扩展Dewey(ED)编码支持高效查询处理但不支持更新操作的问题,提出一种基于动态有限状态转换器(DFST)的动态扩展Dewey编码(DED)。DED编码既支持编码自身的更新操作,又可以避免当文档DTD(文档类型定义)发生变化时已有编码失效的问题,能够完整的支持XML数据的更新操作。进而,针对已有编码方案存储空间消耗过高的问题,提出一种基于霍夫曼编码的改进存储方案,减少编码存储的空间消耗。其次,针对扩展Dewey编码解析途径单一的问题,提出一种基于可逆有限状态转换器(RFST)的查询匹配算法EDTS。RFST通过代价模型选择编码解析策略,支持双向编码解析,提高编码的解析效率和查询处理的整体性能。最后,通过实验对DED编码的有效性和EDTS算法的高效性进行了验证。
其他文献
密码学是解决信息安全问题的核心技术,数字签名作为密码学的关键技术,在信息认证方面发挥着重要作用。可验证加密签名是特殊的数字签名体制,能够实现普通数字签名无法解决的
随着业务流程管理的不断发展,以数据为中心的业务流程管理成为一种新的趋势,典型代表是IBM提出的用Artifact来作为业务流程中的核心数据的思想。ArtiFlow是一种以Artifact为