支持高效动态更新的XML数据编码方法研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:l4992324
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机和网络技术的不断发展,XML技术的应用得到了不断的扩展,它事实上已经成为数据交换的标准和SOA架构的基石。XML作为一种特殊的半结构化数据,与关系数据模型中的数据是不同的。XML数据库是一个XML数据的集合,这些数据是持久的并且是可操作的。有效地存储和查询XML数据是XML数据库的一个重要方面,影响系统的效率。基于某种特定编码方法的存储和查询,由于其具有广泛的应用价值,已经成为XML数据领域中的研究热点问题之一基于区间的编码和基于路径的编码是当前针对XML文档树的两大类编码方法。由于XML文档树需要根据应用者的要求进行动态更新,目前提出的XML数据编码方法对这一点都不能提供很好的支持,本文就此进行了相关方面的研究。本文分析比较了当前几种比较流行的数据编码方法,提出了一种新的高效的支持动态更新的XML数据编码方法。该编码方法不仅能够快速准确判断XML文档结构树中任意两个结点之间的关系、计算结点所在的层次,而且在插入结点时的二次编码率为零。本文的主要工作如下:(1)对现有的编码方法进行深入的比较分析,指出这些编码方法的不足和在支持XML文档树动态更新上的缺陷。(2)提出了一种新的支持动态更新的高效编码方法,该方法是前缀编码和奇偶编码的一种扩展和变形,该方法采用的编码方案中的结点编码包含以下三个部分:前缀码、奇偶码和顺序码。把当前结点的父亲结点的编码去除结点码间连接符“.”后的字符串当作当前结点的前缀码,同一父结点下的所有子结点的前缀码都相同,前缀码在判断父子关系、兄弟关系和祖先/后裔关系有重要作用,具有前缀编码的优点;奇偶码的初始值为“1”。当在XML文档中插入结点时,奇偶码的编码规则根据实际需要分为高频率更新和大幅度更新,为了区别高频率更新和大幅度更新,引入插入结点间隔因子α,根据间隔因子来高效支持XML文档的动态更新;顺序码是由字母字符串组成的编码,静态编码算法中顺序码表示XML文档中兄弟结点的顺序,动态编码算法中顺序码表示兄弟结点顺序的同时又用于区分前缀码和奇偶码相同的结点。(3)详细阐述了论文提出的编码方案的相关定义及其实现算法;对编码的特性进行了详细介绍,给出了编码更新算法,并结合实例分类讨论了插入结点后编码的更新情况。(4)结合提出的编码方案提出了一种效率较高的XML数据存储策略,并结合提出的编码方法阐述了在这种存储模式下具体的XML数据查询过程。(5)通过实验,将本文编码方法与已有编码方法进行了时间性能、空间性能、二次编码率及查询性能等方面的比较分析。
其他文献
随着信息技术的飞速发展,互联网上的数据呈现爆炸式增长,其中大部分数据以文本信息的形式存在。在大数据的时代背景下,面对大规模的文本数据,传统的单机串行式文本聚类算法在
随着网络技术和信息技术的快速发展,不同身份认证体系之间的信息需要在保障用户隐私和信息安全的前提下交互和融合。如何既能保障安全,又能在不同身份认证体系之间建立互通机
珍珠产业是中国传统产业,我国的珍珠产量居世界首位。然而,我国的珍珠分选加工过程仍然以人工为主,根据珍珠的颜色、光泽、表面质量和形状进行分选,人工分选成本高、效率低。
现有的广播电视覆盖面较广,但是它越来越难以满足用户的个性化要求。随着国家“十一五”规划中关于电信网、广播电视网、互联网三网融合政策的颁布以及互联网的飞速发展,各运
安卓(Android)移动操作系统基于Linux内核,具有自由开放的源码、兼容丰富硬件和易于开发等特点;随着Google的大力推广,安卓已占领智能可穿戴设备和车载移动设备等市场。近年
视觉选择性注意模型是以认知科学、神经心理学等相关领域的研究成果为基础的,在计算机信息处理中引入并研究这种选择性注意机制,其理论成果对于智能信息研究发展具有重要的意
作为近年来刚刚兴起的概念,云计算很快以不可阻挡之势得到了快速的发展。云计算是一种计算方式,通过互联网将资源“以服务”的形式提供给用户,而用户不需要了解、知晓或者控
随着互联网信息的日益膨胀,人们能够获得的信息越来越多,但要准确、及时的获取需要的最新信息却有些困难。在线索引构建及管理作为搜索系统的重要组成部分,目的是要针对浩瀚
伴随着计算机技术的发展以及移动对象跟踪技术的不断完善,使得大量的轨道数据被采集,并迫切需要对这些数据进行有效的分析以提取出其中隐藏的知识,这就导致了移动对象轨道聚
随着社会经济的发展,人们对安防的需求越来越高,因此智能视频分析技术得到了广泛的重视。人们对相关算法的检测精度以及运行速度都有很高的要求。然而对于高清监控视频,大量